python引入数据集的方法
这篇文章将为大家详细讲解有关python引入数据集的方法,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。
1、通过标准的Python库导入CSV文件:
Python提供了一个标准的类库CSV文件。这个类库中的reader()函数用来导入CSV文件。当CSV文件被读入后,可以利用这些数据生成一个NumPy数组,用来训练算法模型。:
fromcsvimportreaderimportnumpyasnpfilename=input("请输入文件名:")withopen(filename,'rt',encoding='UTF-8')asraw_data:readers=reader(raw_data,delimiter=',')x=list(readers)data=np.array(x)print(data)print(data.shape)
2、通过NumPy导入CSV文件
也可以使用NumPy的loadtxt()函数导入数据。使用这个函数处理的数据没有文件头,并且所有的数据结构都是一样的,也就是说,数据类型是一样的。
fromnumpyimportloadtxtfilename=input("文件名:")withopen(filename,'rt',encoding='UTF-8')asraw_data:data=loadtxt(raw_data,delimiter=',')print(data)
3、通过Pandas导入CSV文件
通过Pandas来导入CSV文件要使用pandas.read_csv()函数。这个函数的返回值是DataFrame,可以很方便的进行下一步的处理,实际操作过程中推荐使用这种方法。
在机器学习的项目中,经常利用Pandas来做数据清洗与数据准备工作。
frompandasimportread_csvfilename=input("文件名:")f=open(filename,encoding='UTF-8')names=['作业日期','ηCO','ηH2','TF(℃)','TC(℃)','mass','送风流量']data=read_csv(f,names=names)print(data)
关于python引入数据集的方法就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。
声明:本站所有文章资源内容,如无特殊说明或标注,均为采集网络资源。如若本站内容侵犯了原著者的合法权益,可联系本站删除。