CFACommon类提供常用的工具方法,主要应用于:
pip install FreeAeon-ML
CFACommon是静态方法工具类,无需实例化即可使用。
@staticmethod
def load_csv(file_name, chunksize=1000)
分块加载大型CSV文件并显示进度条。
参数: - file_name: CSV文件路径 - chunksize: 每块行数(默认1000)
返回: pandas DataFrame
示例:
from FreeAeonML.FACommon import CFACommon
# 加载大文件
df = CFACommon.load_csv('large_file.csv', chunksize=5000)
print(df.shape)
print(df.head())
from FreeAeonML.FACommon import CFACommon
import pandas as pd
import numpy as np
# 创建测试文件
print("创建测试CSV文件...")
df_test = pd.DataFrame({
'id': range(50000),
'value': np.random.randn(50000),
'category': np.random.choice(['A', 'B', 'C'], 50000)
})
df_test.to_csv('test_large.csv', index=False)
# 使用load_csv加载
print("\n使用CFACommon.load_csv加载...")
df = CFACommon.load_csv('test_large.csv', chunksize=10000)
print(f"\n加载完成!")
print(f"数据形状: {df.shape}")
print(f"内存占用: {df.memory_usage(deep=True).sum() / 1024**2:.2f} MB")
print(f"\n前5行数据:")
print(df.head())
推荐:10000-50000
大文件加载:
自动使用tqdm显示进度
内存管理: