Board logo

标题: Pandas的数据清洗 [打印本页]

作者: admin    时间: 2023-9-26 10:31     标题: Pandas的数据清洗

###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=['第一次','第二次','第三次']) #设置索引(行标题) print(df) print("-" * 10) print("-" * 10) df['数学成绩的升降情况'] = df['数学成绩'] - df['数学成绩'].shift() #数据移位 print(df) 脚本运行的结果:(NaN为缺失值) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 数学成绩的升降情况 第一次 111.0 106.0 NaN 第二次 105.0 120.0 14.0 第三次 99.5 115.5 -4.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据: Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']] print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据: Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']] print(Result_1) print("-" * 10) ## 分别判断各个值是否为NaN:(为NaN时,结果显示为True) Result_2 = df.isnull() print(Result_2) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 语文成绩 数学成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 False False True 第二次 False False False 第三次 False False False C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 重新设置各个列的位置: Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 重新设置各个列的位置: Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(Result_1) ## 分别判断各个值是否为NaN:(为NaN时,结果显示为False) Result_2 = df.notnull() print(Result_2) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 语文成绩 数学成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 True True False 第二次 True True True 第三次 True True True C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“数学成绩”那一列中含有缺失值的行数据:') Result_1 = df[df['数学成绩'].isnull()] print(Result_1) print("-" * 10) print('输出“语文成绩”那一列中含有缺失值的行数据:') Result_2 = df[df['语文成绩'].isnull()] print(Result_2) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“数学成绩”那一列中含有缺失值的行数据: Empty DataFrame Columns: [数学成绩, 语文成绩, 语文成绩的升降情况] Index: [] ---------- 输出“语文成绩”那一列中含有缺失值的行数据: Empty DataFrame Columns: [数学成绩, 语文成绩, 语文成绩的升降情况] Index: [] C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中含有缺失值的行数据:') Result_1 = df[df['语文成绩的升降情况'].isnull()] print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中含有缺失值的行数据: 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“数学成绩”那一列中不含有缺失值的行数据:') Result_1 = df[df['数学成绩'].notnull()] print(Result_1) print("-" * 10) print('输出“语文成绩”那一列中不含有缺失值的行数据:') Result_2 = df[df['语文成绩'].notnull()] print(Result_2) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“数学成绩”那一列中不含有缺失值的行数据: 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩”那一列中不含有缺失值的行数据: 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:') Result_1 = df[df['语文成绩的升降情况'].notnull()] print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中不含有缺失值的行数据: 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) ## 把“语文成绩的升降情况”那一列的缺失值填充为数值“0” : df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna(0) print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 0.0 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) ## 把“语文成绩的升降情况”那一列的缺失值填充为字符串“空值(Null)” : df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna('空值(Null)') print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 空值(Null) 第二次 120.0 105.0 -6 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,106,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) print(df.drop_duplicates(['数学成绩'])) #去除指定列的重复数据,只保留第一行的行数据 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 106.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,106,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据,只保留第一行的行数据: Result_1 = df.drop_duplicates(['数学成绩'],keep='first') print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 106.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,106,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据,只保留最后一行的行数据: Result_1 = df.drop_duplicates(['数学成绩'],keep='last') print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 106.0 第三次 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 zhuohua的三次考试成绩 第二次 105.0 106.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,119,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据,只保留最后一行的行数据: Result_1 = df.drop_duplicates(['班级'],keep='last') print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 zhuohua 99.5 115 130 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,106,115], '英语成绩':[109,119,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据,不保留其行数据: Result_1 = df.drop_duplicates(['数学成绩'],keep=False) print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 zhuohua 99.5 115 130 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,106,115], '英语成绩':[109,119,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据,不保留其行数据: Result_1 = df.drop_duplicates(['班级'],keep=False) print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_index = ['李大杰','Jacky','zhuohua'] Key_columns = ['语文成绩','数学成绩','英语成绩','班级'] Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据,不保留其行数据: Result_1 = df.drop_duplicates(['班级'],keep=False) print(Result_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_columns = ['语文成绩','数学成绩','英语成绩','班级'] Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,2,0]) #重新设置索引 print(df) 脚本运行的结果:(这里重新设置了各个行的位置) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 0 111.0 106 109 三年一班 1 105.0 106 119 三年二班 2 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 1 105.0 106 119 三年二班 2 99.5 115 130 三年二班 0 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,2,0]) #重新设置索引 print(df) 脚本运行的结果:(这里重新设置了各个行的位置) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 2 99.5 115.5 0 111.0 106.0 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2]) #重新设置索引 print(df) 脚本运行的结果:(NaN为缺失值) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,2,3,4,5]) #重新设置索引 print(df) 脚本运行的结果:(索引为数值“0”的那行数据没有出现了) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 2 99.5 115.5 3 NaN NaN 4 NaN NaN 5 NaN NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,4,5,2],fill_value=0) #重新设置索引,并把所有列的缺失值都填充为数值“0” print(df) 脚本运行的结果:(索引为数值“0”的那行数据没有出现了) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 3 0.0 0.0 4 0.0 0.0 5 0.0 0.0 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,3,4,5,2]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(0) #只把“数学成绩”那一列的缺失值填充为数值“0” print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 3 NaN NaN 4 NaN NaN 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 3 NaN 0.0 4 NaN 0.0 5 NaN 0.0 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,4,5,2],fill_value='(空值(Null)') #重新设置索引,并把所有列的缺失值填充为字符串“(空值(Null)” print(df) 脚本运行的结果:(索引为数值“0”的那行数据没有出现了) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105 120 3 (空值(Null) (空值(Null) 4 (空值(Null) (空值(Null) 5 (空值(Null) (空值(Null) 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,3,4,5,2]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna('空值') #只把“数学成绩”那一列的缺失值填充为字符串“空值” print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 3 NaN NaN 4 NaN NaN 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩 数学成绩 0 111.0 106 1 105.0 120 3 NaN 空值 4 NaN 空值 5 NaN 空值 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df = df.fillna(method='ffill') #所有列的缺失值都使用前一个非缺失值进行填充(和上面的一个数据一样) print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩 数学成绩 1 105.0 120.0 3 105.0 120.0 0 111.0 106.0 5 111.0 106.0 2 99.5 115.5 4 99.5 115.5 6 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(method='ffill') #只把“数学成绩”那一列的缺失值使用前一个非缺失值进行填充 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN 120.0 0 111.0 106.0 5 NaN 106.0 2 99.5 115.5 4 NaN 115.5 6 NaN 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df = df.fillna(method='bfill') #所有列的缺失值都使用后一个非缺失值进行填充(和下面的一个数据一样) print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩 数学成绩 1 105.0 120.0 3 111.0 106.0 0 111.0 106.0 5 99.5 115.5 2 99.5 115.5 4 NaN NaN 6 NaN NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(method='bfill') #只把“数学成绩”那一列的缺失值使用后一个非缺失值进行填充 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN 106.0 0 111.0 106.0 5 NaN 115.5 2 99.5 115.5 4 NaN NaN 6 NaN NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,2,3]) #重新设置索引 print(df) print("-" * 10) ## 所有列的缺失值都使用各个列的总和值进行填充: df_1 = df.fillna(df.sum()) print(df_1) print("-" * 10) df_1.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题 print(df_1) print("-" * 10) print("-" * 10) ## 所有列的缺失值都使用各个列的平均值进行填充: df_2 = df.fillna(df.mean()) print(df_2) print("-" * 10) df_2.rename({3:'各个列的平均值'},axis=0,inplace=True) #修改一个行标题 print(df_2) print("-" * 10) print("-" * 10) ## 所有列的缺失值都使用各个列的中位数进行填充: df_3 = df.fillna(df.median()) print(df_3) print("-" * 10) df_3.rename({3:'各个列的中位数'},axis=0,inplace=True) #修改一个行标题 print(df_3) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN NaN ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 315.5 341.5 ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 各个列的总和 315.5 341.5 ---------- ---------- 语文成绩 数学成绩 0 111.000000 106.000000 1 105.000000 120.000000 2 99.500000 115.500000 3 105.166667 113.833333 ---------- 语文成绩 数学成绩 0 111.000000 106.000000 1 105.000000 120.000000 2 99.500000 115.500000 各个列的平均值 105.166667 113.833333 ---------- ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 105.0 115.5 ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 各个列的中位数 105.0 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,2,3]) #重新设置索引 print(df) print("-" * 10) ## 只把“数学成绩”那一列的缺失值使用该列的总和值进行填充: df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].sum()) print(df) print("-" * 10) df.rename({3:'“数学成绩”那一列的总和'},axis=0,inplace=True) #修改一个行标题 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN NaN ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN 341.5 ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 “数学成绩”那一列的总和 NaN 341.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['zhuohua','Jacky','李大杰']) #重新设置索引 print(df) 脚本运行的结果:(这里重新设置了各个行的位置) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 zhuohua 99.5 115 130 三年二班 Jacky 105.0 88 120 三年二班 李大杰 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df_1 = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value=8) #重新设置索引,并把所有列的缺失值都填充为数值“8” print(df_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 mr001 8.0 8 8 8 李大杰 111.0 106 109 三年一班 mr003 8.0 8 8 8 zhuohua 99.5 115 130 三年二班 Jacky 105.0 88 120 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky']) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(1) #只把“数学成绩”那一列的缺失值填充为数值“1” print(df) print("-" * 10) df['英语成绩'] = df['英语成绩'].fillna(2) #再把“英语成绩”那一列的缺失值填充为数值“2” print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 mr001 NaN NaN NaN NaN 李大杰 111.0 106.0 109.0 三年一班 mr003 NaN NaN NaN NaN zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 ---------- 语文成绩 数学成绩 英语成绩 班级 mr001 NaN 1.0 NaN NaN 李大杰 111.0 106.0 109.0 三年一班 mr003 NaN 1.0 NaN NaN zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 ---------- 语文成绩 数学成绩 英语成绩 班级 mr001 NaN 1.0 2.0 NaN 李大杰 111.0 106.0 109.0 三年一班 mr003 NaN 1.0 2.0 NaN zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value='空值') #重新设置索引,并把所有列的缺失值都填充为字符串“空值” print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 mr001 空值 空值 空值 空值 李大杰 111 106 109 三年一班 mr003 空值 空值 空值 空值 zhuohua 99.5 115 130 三年二班 Jacky 105 88 120 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最大值']) #重新设置索引 print(df) print("-" * 10) ## 把“数学成绩”那一列的缺失值使用该列的最大值进行填充: df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].max()) ## 把“班级”那一列的缺失值填充为字符串“最大值”: df['班级'] = df['班级'].fillna('最大值') print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 各个列的最大值 NaN NaN NaN NaN ---------- 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 各个列的最大值 NaN 115.0 NaN 最大值 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最小值']) #重新设置索引 print(df) print("-" * 10) ## 把“数学成绩”那一列的缺失值使用该列的最小值进行填充: df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].min()) ## 把“班级”那一列的缺失值填充为字符串“最小值”: df['班级'] = df['班级'].fillna('最小值') print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 各个列的最小值 NaN NaN NaN NaN ---------- 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 各个列的最小值 NaN 88.0 NaN 最小值 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df_1 = df.reindex(columns=['班级','数学成绩','英语成绩','语文成绩']) #重新设置列 print(df_1) print("-" * 10) df_1.rename(columns={'英语成绩':'英语成绩(New)'},inplace=True) #修改一个列标题 print(df_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级 数学成绩 英语成绩 语文成绩 李大杰 三年一班 106 109 111.0 Jacky 三年二班 88 120 105.0 zhuohua 三年二班 115 130 99.5 ---------- 班级 数学成绩 英语成绩(New) 语文成绩 李大杰 三年一班 106 109 111.0 Jacky 三年二班 88 120 105.0 zhuohua 三年二班 115 130 99.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 重新设置列,并把所有列的缺失值都填充为数值“8”: df_1 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8) print(df_1) print("-" * 10) ## 重新设置列,并把所有列的缺失值都填充为字符串“空值”: df_2 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值') print(df_2) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- mr001 班级 数学成绩 英语成绩 物理成绩 语文成绩 李大杰 8 三年一班 106 109 8 111.0 Jacky 8 三年二班 88 120 8 105.0 zhuohua 8 三年二班 115 130 8 99.5 ---------- mr001 班级 数学成绩 英语成绩 物理成绩 语文成绩 李大杰 空值 三年一班 106 109 空值 111.0 Jacky 空值 三年二班 88 120 空值 105.0 zhuohua 空值 三年二班 115 130 空值 99.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置列 print(df) print("-" * 10) df['物理成绩'] = df['物理成绩'].fillna(8) #只把“物理成绩”那一列的缺失值填充为数值“8” print(df) print("-" * 10) df['mr001'] = df['mr001'].fillna('空值') #再把“mr001”那一列的缺失值填充为字符串“空值” print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- mr001 班级 数学成绩 英语成绩 物理成绩 语文成绩 李大杰 NaN 三年一班 106 109 NaN 111.0 Jacky NaN 三年二班 88 120 NaN 105.0 zhuohua NaN 三年二班 115 130 NaN 99.5 ---------- mr001 班级 数学成绩 英语成绩 物理成绩 语文成绩 李大杰 NaN 三年一班 106 109 8.0 111.0 Jacky NaN 三年二班 88 120 8.0 105.0 zhuohua NaN 三年二班 115 130 8.0 99.5 ---------- mr001 班级 数学成绩 英语成绩 物理成绩 语文成绩 李大杰 空值 三年一班 106 109 8.0 111.0 Jacky 空值 三年二班 88 120 8.0 105.0 zhuohua 空值 三年二班 115 130 8.0 99.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级'] Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.set_index(['姓名']) #设置指定列的数据为索引 print(df) print("-" * 10) df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列 print(df) print("-" * 10) df['各位同学的总成绩'] = df.sum(axis=1) #按行求和 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 姓名 语文成绩 数学成绩 英语成绩 班级 0 李大杰 111.0 106 109 三年一班 1 Jacky 105.0 106 119 三年二班 2 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 姓名 李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- 语文成绩 数学成绩 英语成绩 姓名 李大杰 111.0 106 109 Jacky 105.0 106 119 zhuohua 99.5 115 130 ---------- 语文成绩 数学成绩 英语成绩 各位同学的总成绩 姓名 李大杰 111.0 106 109 326.0 Jacky 105.0 106 119 330.0 zhuohua 99.5 115 130 344.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_index = ['李大杰','Jacky','zhuohua'] Key_columns = ['语文成绩','数学成绩','英语成绩','班级'] Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列 print(df) print("-" * 10) df['各位同学的平均成绩'] = df.mean(axis=1) #按行求平均值 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 李大杰 111.0 106 109 Jacky 105.0 106 119 zhuohua 99.5 115 130 ---------- 语文成绩 数学成绩 英语成绩 各位同学的平均成绩 李大杰 111.0 106 109 108.666667 Jacky 105.0 106 119 110.000000 zhuohua 99.5 115 130 114.833333 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df_1 = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置索引、列 print(df_1) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级 数学成绩 英语成绩 物理成绩 语文成绩 mr001 NaN NaN NaN NaN NaN 李大杰 三年一班 106.0 109.0 NaN 111.0 mr003 NaN NaN NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 重新设置索引、列,并把所有列的缺失值都填充为数值“8”: df_1 = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8) print(df_1) print("-" * 10) ## 重新设置引、列,并把所有列的缺失值都填充为字符串“空值”: df_2 = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值') print(df_2) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级 数学成绩 英语成绩 物理成绩 语文成绩 mr001 8 8 8 8 8.0 李大杰 三年一班 106 109 8 111.0 mr003 8 8 8 8 8.0 zhuohua 三年二班 115 130 8 99.5 Jacky 三年二班 88 120 8 105.0 ---------- 班级 数学成绩 英语成绩 物理成绩 语文成绩 mr001 空值 空值 空值 空值 空值 李大杰 三年一班 106 109 空值 111 mr003 空值 空值 空值 空值 空值 zhuohua 三年二班 115 130 空值 99.5 Jacky 三年二班 88 120 空值 105 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 重新设置索引、列: df = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩']) print(df) print("-" * 10) ## 只把“数学成绩”那一列的缺失值填充为数值“1”: df['数学成绩'] = df['数学成绩'].fillna(1) print(df) print("-" * 10) ## 再把“班级”那一列的缺失值填充为字符串“空值”: df['班级'] = df['班级'].fillna('空值') print(df) print("-" * 10) ## 再修改“mr003”的“英语成绩”为 100 : df.loc['mr003','英语成绩'] = 100 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级 数学成绩 英语成绩 物理成绩 语文成绩 mr001 NaN NaN NaN NaN NaN 李大杰 三年一班 106.0 109.0 NaN 111.0 mr003 NaN NaN NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 ---------- 班级 数学成绩 英语成绩 物理成绩 语文成绩 mr001 NaN 1.0 NaN NaN NaN 李大杰 三年一班 106.0 109.0 NaN 111.0 mr003 NaN 1.0 NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 ---------- 班级 数学成绩 英语成绩 物理成绩 语文成绩 mr001 空值 1.0 NaN NaN NaN 李大杰 三年一班 106.0 109.0 NaN 111.0 mr003 空值 1.0 NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 ---------- 班级 数学成绩 英语成绩 物理成绩 语文成绩 mr001 空值 1.0 NaN NaN NaN 李大杰 三年一班 106.0 109.0 NaN 111.0 mr003 空值 1.0 100.0 NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2]) #重新设置索引 print(df) print("-" * 10) ## 再修改索引为数值“3”的“数学成绩”为 100 : df.loc[3,'数学成绩'] = 100 print(df) print("-" * 10) ## 删除含有缺失值的行数据:(针对所有的列) df = df.dropna() print(df) print("-" * 10) ## 删除旧索引后,重新设置索引:(索引默认从0开始) df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩 数学成绩 1 105.0 120.0 3 NaN 100.0 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩 数学成绩 1 105.0 120.0 0 111.0 106.0 2 99.5 115.5 ---------- 语文成绩 数学成绩 0 105.0 120.0 1 111.0 106.0 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) ## 删除含有缺失值的行数据:(针对所有的列) df = df.dropna() print(df) print("-" * 10) ## 删除旧索引后,重新设置索引:(索引默认从0开始) df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py zhuohua的三次考试成绩 语文成绩 数学成绩 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- ---------- zhuohua的三次考试成绩 数学成绩 语文成绩 语文成绩的升降情况 0 第一次 106.0 111.0 NaN 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- zhuohua的三次考试成绩 数学成绩 语文成绩 语文成绩的升降情况 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- zhuohua的三次考试成绩 数学成绩 语文成绩 语文成绩的升降情况 0 第二次 120.0 105.0 -6.0 1 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:') df = df[df['语文成绩的升降情况'].notnull()] print(df) print("-" * 10) ## 删除旧索引后,重新设置索引:(索引默认从0开始) df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py zhuohua的三次考试成绩 语文成绩 数学成绩 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- ---------- zhuohua的三次考试成绩 数学成绩 语文成绩 语文成绩的升降情况 0 第一次 106.0 111.0 NaN 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中不含有缺失值的行数据: zhuohua的三次考试成绩 数学成绩 语文成绩 语文成绩的升降情况 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- zhuohua的三次考试成绩 数学成绩 语文成绩 语文成绩的升降情况 0 第二次 120.0 105.0 -6.0 1 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置: df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:') df = df[df['语文成绩的升降情况'].notnull()] print(df) print("-" * 10) ## 删除旧索引后,重新设置索引:(索引默认从0开始) df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中不含有缺失值的行数据: 数学成绩 语文成绩 语文成绩的升降情况 zhuohua的三次考试成绩 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 数学成绩 语文成绩 语文成绩的升降情况 0 120.0 105.0 -6.0 1 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 英语成绩 班级 李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 李大杰 语文成绩 111 数学成绩 106 英语成绩 109 班级 三年一班 Jacky 语文成绩 105 数学成绩 88 英语成绩 120 班级 三年二班 zhuohua 语文成绩 99.5 数学成绩 115 英语成绩 130 班级 三年二班 dtype: object C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }) print(df) print("-" * 10) print("-" * 10) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 姓名 语文成绩 数学成绩 班级 0 李大杰 111.0 106.0 三年一班 1 Jacky 105.0 120.0 三年二班 2 zhuohua 99.5 115.5 三年一班 ---------- ---------- 语文成绩 数学成绩 班级 姓名 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 三年一班 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) print(df) print("-" * 10) print("-" * 10) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 姓名 语文成绩 数学成绩 班级 0 李大杰 111.0 106.0 三年一班 1 Jacky 105.0 120.0 三年二班 2 zhuohua 99.5 115.5 三年二班 ---------- ---------- 语文成绩 数学成绩 班级 姓名 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引 print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 班级 姓名 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 三年一班 zhuohua 99.5 115.5 ---------- ---------- 班级 姓名 三年一班 李大杰 语文成绩 111.0 数学成绩 106.0 三年二班 Jacky 语文成绩 105.0 数学成绩 120.0 三年一班 zhuohua 语文成绩 99.5 数学成绩 115.5 dtype: float64 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引 print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 班级 姓名 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 ---------- ---------- 班级 姓名 三年一班 李大杰 语文成绩 111.0 数学成绩 106.0 三年二班 Jacky 语文成绩 105.0 数学成绩 120.0 zhuohua 语文成绩 99.5 数学成绩 115.5 dtype: float64 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引 print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) print("-" * 10) print("-" * 10) df = df.unstack() #把所有行转换为列 print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 班级 姓名 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 ---------- ---------- 班级 姓名 三年一班 李大杰 语文成绩 111.0 数学成绩 106.0 三年二班 Jacky 语文成绩 105.0 数学成绩 120.0 zhuohua 语文成绩 99.5 数学成绩 115.5 dtype: float64 ---------- ---------- 语文成绩 数学成绩 班级 姓名 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }) print(df) print("-" * 10) print("-" * 10) print("输出各个班级的学生的语文成绩:") ## 以“姓名”那一列的数据为行,以“班级”那一列的数据为列,以“语文成绩”那一列的数据为填充值: df = df.pivot(index='姓名',columns='班级',values='语文成绩') print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 姓名 语文成绩 数学成绩 班级 0 李大杰 111.0 106.0 三年一班 1 Jacky 105.0 120.0 三年二班 2 zhuohua 99.5 115.5 三年一班 ---------- ---------- 输出各个班级的学生的语文成绩: 班级 三年一班 三年二班 姓名 Jacky NaN 105.0 zhuohua 99.5 NaN 李大杰 111.0 NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }, index=[1,2,3]) print(df) print("-" * 10) print("-" * 10) print("输出各个班级的学生的数学成绩:") ## 以“姓名”那一列的数据为行,以“班级”那一列的数据为列,以“数学成绩”那一列的数据为填充值: df = df.pivot(index='姓名',columns='班级',values='数学成绩') print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 姓名 语文成绩 数学成绩 班级 1 李大杰 111.0 106.0 三年一班 2 Jacky 105.0 120.0 三年二班 3 zhuohua 99.5 115.5 三年一班 ---------- ---------- 输出各个班级的学生的数学成绩: 班级 三年一班 三年二班 姓名 Jacky NaN 120.0 zhuohua 115.5 NaN 李大杰 106.0 NaN C:\Users\jacky\Desktop> Pandas的导出和导入(html文件): Win7连接公网安装第三方库(lxml): C:\Users\jacky\Desktop>pip3 install lxml==4.9.3 -i http://mirrors.aliyun.com/pypi/simple --trusted-host=mirrors.aliyun.com 第三方库(lxml)安装成功: C:\Users\jacky\Desktop>pip3 freeze lxml==4.9.3 numpy==1.19.5 pandas==1.1.5 python-dateutil==2.8.2 pytz==2023.3 six==1.16.0 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) ## 把结果分别导出到指定的html文件: df.to_html('C:\\Users\\jacky\\Desktop\\mybook_1.html',index=False,header=True) #不保留索引(行标题),但保留列标题 df.to_html('C:/Users/jacky/Desktop/mybook_2.html',index=False,header=False) #不保留索引(行标题)、列标题 df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引(行标题)、列标题 脚本运行的结果:(假如目标文件存在则覆盖,不存在则自动创建) C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件 print(df) print(type(df)) print("-" * 10) print("-" * 10) print(df[0]) print("-" * 10) ## 修改一个列标题: df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True) print(df[0]) print("-" * 10) ## 修改多个列标题: df[0].rename(columns={'Unnamed: 1_level_1':'语文','Unnamed: 2_level_1':None},inplace=True) print(df[0]) print("-" * 10) ## 不输出索引: df[0] = df[0].to_string(index=False) print(df[0]) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py [ Unnamed: 0_level_0 语文成绩 数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5] ---------- ---------- Unnamed: 0_level_0 语文成绩 数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩 语文成绩 数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩 语文成绩 数学成绩 zhuohua的三次考试成绩 语文 NaN 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩 语文成绩 数学成绩 zhuohua的三次考试成绩 语文 NaN 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd def func1(): #自定义导出的函数 pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) ## 把结果导出到指定的html文件: df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引(行标题)、列标题 print("-" * 10) print("-" * 10) print("-" * 10) func2() #执行func2() def func2(): #自定义导入的函数 pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件 print(df) print(type(df)) print("-" * 10) print("-" * 10) print(df[0]) print("-" * 10) ## 修改一个列标题: df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True) ## 修改多个列标题: df[0].rename(columns={'Unnamed: 1_level_1':0,'Unnamed: 2_level_1':0},inplace=True) print(df[0]) print("-" * 10) ## 不输出索引: df[0] = df[0].to_string(index=False) print(df[0]) if __name__ == '__main__': func1() #执行func1() 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 zhuohua的三次考试成绩 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- ---------- [ Unnamed: 0_level_0 语文成绩 数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5] ---------- ---------- Unnamed: 0_level_0 语文成绩 数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩 语文成绩 数学成绩 zhuohua的三次考试成绩 0 0 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩 语文成绩 数学成绩 zhuohua的三次考试成绩 0 0 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd def func1(): #自定义导出的函数 pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引 print(df) ## 把结果导出到指定的html文件: df.to_html('d:/share/mybook_4.html',index=True,header=True) #保留索引(行标题)、列标题 def func2(): #自定义导入的函数 pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:\\share\\mybook_4.html',encoding='utf-8') #导入指定的html文件 print(df) print(type(df)) print("-" * 10) print("-" * 10) print(df[0]) print("-" * 10) ## 修改多个列标题: df[0].rename(columns={'Unnamed: 0_level_0':0,'Unnamed: 1_level_0':None},inplace=True) ## 修改多个列标题: df[0].rename(columns={'Unnamed: 2_level_1':None,'Unnamed: 3_level_1':'B'},inplace=True) print(df[0]) print("-" * 10) ## 不输出索引: df[0] = df[0].to_string(index=False) print(df[0]) if __name__ == '__main__': func1() #执行func1() print("-" * 10) print("-" * 10) print("-" * 10) func2() #执行func2() 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 班级 姓名 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 ---------- ---------- ---------- [ Unnamed: 0_level_0 Unnamed: 1_level_0 语文成绩 数学成绩 班级 姓名 Unnamed: 2_level_1 Unnamed: 3_level_1 0 三年一班 李大杰 111.0 106.0 1 三年二班 Jacky 105.0 120.0 2 三年二班 zhuohua 99.5 115.5] ---------- ---------- Unnamed: 0_level_0 Unnamed: 1_level_0 语文成绩 数学成绩 班级 姓名 Unnamed: 2_level_1 Unnamed: 3_level_1 0 三年一班 李大杰 111.0 106.0 1 三年二班 Jacky 105.0 120.0 2 三年二班 zhuohua 99.5 115.5 ---------- 0 NaN 语文成绩 数学成绩 班级 姓名 NaN B 0 三年一班 李大杰 111.0 106.0 1 三年二班 Jacky 105.0 120.0 2 三年二班 zhuohua 99.5 115.5 ---------- 0 NaN 语文成绩 数学成绩 班级 姓名 NaN B 三年一班 李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 三年二班 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,2,3]) #重新设置索引 print(df) print("-" * 10) ## 所有列的缺失值都使用各个列的总和值进行填充: df = df.fillna(df.sum()) print(df) print("-" * 10) df.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题 print(df) print("-" * 3) df.rename({0:'李大杰',1:'Jacky',2:'zhuohua'},axis=0,inplace=True) #修改多个行标题 print(df) ## 把结果导出到指定的html文件: df.to_html('D:/mybook_5.html',index=True,header=True) #保留索引(行标题)、列标题 print("-" * 10) print("-" * 10) print("-" * 10) Result_2 = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件 print(Result_2) print("-" * 3) print(Result_2[0]) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN NaN ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 315.5 341.5 ---------- 语文成绩 数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 各个列的总和 315.5 341.5 --- 语文成绩 数学成绩 李大杰 111.0 106.0 Jacky 105.0 120.0 zhuohua 99.5 115.5 各个列的总和 315.5 341.5 ---------- ---------- ---------- [ Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5] --- Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件 print(df) print("-" * 3) print(df[0]) print("-" * 10) print("-" * 10) ## 把结果导出到指定的txt文件: df[0].to_csv("D:/mybook_5.txt",sep='\t',index=False,header=True) #不保留索引(行标题),但保留列标题 ## 导入指定的txt文件: df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8') print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py [ Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5] --- Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 ---------- ---------- Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8') #导入指定的txt文件 print(df) print("-" * 10) print("-" * 10) ## 把结果导出到指定的html文件: df.to_html('D:/mybook_5.html',index=False,header=True) #不保留索引(行标题),但保留列标题 ## 导入指定的html文件: df = pd.read_html('D:/mybook_5.html',encoding='utf-8') print(df) print("-" * 3) print(df[0]) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 ---------- ---------- [ Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5] --- Unnamed: 0 语文成绩 数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级'] Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.set_index(['姓名']) #设置指定列的数据为索引 print(df) print("-" * 10) df['各位同学的总成绩'] = df.sum(axis=1) #按行求和 print(df) print("-" * 10) df = df.reindex(columns=['班级','各位同学的总成绩']) #重新设置列 print(df) ## 把结果导出到指定的html文件: df.to_html('D:/Pandas的基础-6.html',index=True,header=True) #保留索引(行标题)、列标题 print("-" * 10) print("-" * 10) print("-" * 10) Result_2 = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件 print(Result_2) print("-" * 3) print(Result_2[0]) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py 姓名 语文成绩 数学成绩 英语成绩 班级 0 李大杰 111.0 106 109 三年一班 1 Jacky 105.0 106 119 三年二班 2 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩 数学成绩 英语成绩 班级 姓名 李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- 语文成绩 数学成绩 英语成绩 班级 各位同学的总成绩 姓名 李大杰 111.0 106 109 三年一班 326.0 Jacky 105.0 106 119 三年二班 330.0 zhuohua 99.5 115 130 三年二班 344.5 ---------- 班级 各位同学的总成绩 姓名 李大杰 三年一班 326.0 Jacky 三年二班 330.0 zhuohua 三年二班 344.5 ---------- ---------- ---------- [ Unnamed: 0_level_0 班级 各位同学的总成绩 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰 三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5] --- Unnamed: 0_level_0 班级 各位同学的总成绩 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰 三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件 print(df) print("-" * 3) print(df[0]) print("-" * 10) print("-" * 10) ## 把结果导出到指定的csv文件: df[0].to_csv("D:/Pandas的基础-6.csv",sep='\t',index=False,header=True) #不保留索引(行标题),但保留列标题 ## 导入指定的csv文件: df = pd.read_csv('D:/Pandas的基础-6.csv',sep='\t',encoding='utf-8') print(df) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py [ Unnamed: 0_level_0 班级 各位同学的总成绩 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰 三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5] --- Unnamed: 0_level_0 班级 各位同学的总成绩 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰 三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5 ---------- ---------- Unnamed: 0_level_0 班级 各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰 三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_csv("D:/Pandas的基础-6.csv",sep='\t',encoding='utf-8') #导入指定的csv文件 print(df) print("-" * 10) print("-" * 10) ## 把结果导出到指定的html文件: df.to_html('D:/Pandas的基础_5.html',index=False,header=True) #不保留索引(行标题),但保留列标题 ## 导入指定的html文件: df = pd.read_html('d:/Pandas的基础_5.html',encoding='utf-8') print(df) print("-" * 3) print(df[0]) 脚本运行的结果: C:\Users\jacky\Desktop>python xx.py Unnamed: 0_level_0 班级 各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰 三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5 ---------- ---------- [ Unnamed: 0_level_0 班级 各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰 三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5] --- Unnamed: 0_level_0 班级 各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰 三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5 C:\Users\jacky\Desktop> 相关文章: Pandas的基础 Pandas的日期时间数据转换




欢迎光临 blog.zhuohua.store (http://blog.zhuohua.store/) Powered by Discuz! 7.2