blog.zhuohua.store - Powered by Discuz! Board

标题: Pandas的数据清洗 [打印本页]

作者: admin 时间: 2023-9-26 10:31 标题: Pandas的数据清洗

###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=['第一次','第二次','第三次']) #设置索引（行标题） print(df) print("-" * 10) print("-" * 10) df['数学成绩的升降情况'] = df['数学成绩'] - df['数学成绩'].shift() #数据移位 print(df) 脚本运行的结果：（NaN为缺失值） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩数学成绩的升降情况第一次 111.0 106.0 NaN 第二次 105.0 120.0 14.0 第三次 99.5 115.5 -4.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据： Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']] print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据： Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']] print(Result_1) print("-" * 10) ## 分别判断各个值是否为NaN：（为NaN时，结果显示为True） Result_2 = df.isnull() print(Result_2) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 语文成绩数学成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 False False True 第二次 False False False 第三次 False False False C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 重新设置各个列的位置： Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 print(df) print("-" * 10) ## 重新设置各个列的位置： Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(Result_1) ## 分别判断各个值是否为NaN：（为NaN时，结果显示为False） Result_2 = df.notnull() print(Result_2) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 111.0 106.0 NaN 第二次 105.0 120.0 -6.0 第三次 99.5 115.5 -5.5 ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 语文成绩数学成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 True True False 第二次 True True True 第三次 True True True C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“数学成绩”那一列中含有缺失值的行数据：') Result_1 = df[df['数学成绩'].isnull()] print(Result_1) print("-" * 10) print('输出“语文成绩”那一列中含有缺失值的行数据：') Result_2 = df[df['语文成绩'].isnull()] print(Result_2) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“数学成绩”那一列中含有缺失值的行数据： Empty DataFrame Columns: [数学成绩, 语文成绩, 语文成绩的升降情况] Index: [] ---------- 输出“语文成绩”那一列中含有缺失值的行数据： Empty DataFrame Columns: [数学成绩, 语文成绩, 语文成绩的升降情况] Index: [] C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中含有缺失值的行数据：') Result_1 = df[df['语文成绩的升降情况'].isnull()] print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中含有缺失值的行数据：数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“数学成绩”那一列中不含有缺失值的行数据：') Result_1 = df[df['数学成绩'].notnull()] print(Result_1) print("-" * 10) print('输出“语文成绩”那一列中不含有缺失值的行数据：') Result_2 = df[df['语文成绩'].notnull()] print(Result_2) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“数学成绩”那一列中不含有缺失值的行数据：数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩”那一列中不含有缺失值的行数据：数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：') Result_1 = df[df['语文成绩的升降情况'].notnull()] print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) ## 把“语文成绩的升降情况”那一列的缺失值填充为数值“0” ： df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna(0) print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 0.0 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) ## 把“语文成绩的升降情况”那一列的缺失值填充为字符串“空值（Null）” ： df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna('空值（Null）') print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 空值（Null）第二次 120.0 105.0 -6 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,106,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) print(df.drop_duplicates(['数学成绩'])) #去除指定列的重复数据，只保留第一行的行数据脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 106.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,106,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据，只保留第一行的行数据： Result_1 = df.drop_duplicates(['数学成绩'],keep='first') print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 106.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,106,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据，只保留最后一行的行数据： Result_1 = df.drop_duplicates(['数学成绩'],keep='last') print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 106.0 第三次 99.5 115.5 ---------- ---------- 语文成绩数学成绩 zhuohua的三次考试成绩第二次 105.0 106.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,119,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据，只保留最后一行的行数据： Result_1 = df.drop_duplicates(['班级'],keep='last') print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 zhuohua 99.5 115 130 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,106,115], '英语成绩':[109,119,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据，不保留其行数据： Result_1 = df.drop_duplicates(['数学成绩'],keep=False) print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级 zhuohua 99.5 115 130 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,106,115], '英语成绩':[109,119,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据，不保留其行数据： Result_1 = df.drop_duplicates(['班级'],keep=False) print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_index = ['李大杰','Jacky','zhuohua'] Key_columns = ['语文成绩','数学成绩','英语成绩','班级'] Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) ## 去除指定列的重复数据，不保留其行数据： Result_1 = df.drop_duplicates(['班级'],keep=False) print(Result_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_columns = ['语文成绩','数学成绩','英语成绩','班级'] Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,2,0]) #重新设置索引 print(df) 脚本运行的结果：（这里重新设置了各个行的位置） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级 0 111.0 106 109 三年一班 1 105.0 106 119 三年二班 2 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级 1 105.0 106 119 三年二班 2 99.5 115 130 三年二班 0 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,2,0]) #重新设置索引 print(df) 脚本运行的结果：（这里重新设置了各个行的位置） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 2 99.5 115.5 0 111.0 106.0 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2]) #重新设置索引 print(df) 脚本运行的结果：（NaN为缺失值） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,2,3,4,5]) #重新设置索引 print(df) 脚本运行的结果：（索引为数值“0”的那行数据没有出现了） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 2 99.5 115.5 3 NaN NaN 4 NaN NaN 5 NaN NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,4,5,2],fill_value=0) #重新设置索引，并把所有列的缺失值都填充为数值“0” print(df) 脚本运行的结果：（索引为数值“0”的那行数据没有出现了） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 3 0.0 0.0 4 0.0 0.0 5 0.0 0.0 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,3,4,5,2]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(0) #只把“数学成绩”那一列的缺失值填充为数值“0” print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 3 NaN NaN 4 NaN NaN 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 3 NaN 0.0 4 NaN 0.0 5 NaN 0.0 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,4,5,2],fill_value='(空值（Null）') #重新设置索引，并把所有列的缺失值填充为字符串“(空值（Null）” print(df) 脚本运行的结果：（索引为数值“0”的那行数据没有出现了） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105 120 3 (空值（Null） (空值（Null） 4 (空值（Null） (空值（Null） 5 (空值（Null） (空值（Null） 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,3,4,5,2]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna('空值') #只把“数学成绩”那一列的缺失值填充为字符串“空值” print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 3 NaN NaN 4 NaN NaN 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩数学成绩 0 111.0 106 1 105.0 120 3 NaN 空值 4 NaN 空值 5 NaN 空值 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df = df.fillna(method='ffill') #所有列的缺失值都使用前一个非缺失值进行填充（和上面的一个数据一样） print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩数学成绩 1 105.0 120.0 3 105.0 120.0 0 111.0 106.0 5 111.0 106.0 2 99.5 115.5 4 99.5 115.5 6 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(method='ffill') #只把“数学成绩”那一列的缺失值使用前一个非缺失值进行填充 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN 120.0 0 111.0 106.0 5 NaN 106.0 2 99.5 115.5 4 NaN 115.5 6 NaN 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df = df.fillna(method='bfill') #所有列的缺失值都使用后一个非缺失值进行填充（和下面的一个数据一样） print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩数学成绩 1 105.0 120.0 3 111.0 106.0 0 111.0 106.0 5 99.5 115.5 2 99.5 115.5 4 NaN NaN 6 NaN NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(method='bfill') #只把“数学成绩”那一列的缺失值使用后一个非缺失值进行填充 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 4 NaN NaN 6 NaN NaN ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN 106.0 0 111.0 106.0 5 NaN 115.5 2 99.5 115.5 4 NaN NaN 6 NaN NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,2,3]) #重新设置索引 print(df) print("-" * 10) ## 所有列的缺失值都使用各个列的总和值进行填充： df_1 = df.fillna(df.sum()) print(df_1) print("-" * 10) df_1.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题 print(df_1) print("-" * 10) print("-" * 10) ## 所有列的缺失值都使用各个列的平均值进行填充： df_2 = df.fillna(df.mean()) print(df_2) print("-" * 10) df_2.rename({3:'各个列的平均值'},axis=0,inplace=True) #修改一个行标题 print(df_2) print("-" * 10) print("-" * 10) ## 所有列的缺失值都使用各个列的中位数进行填充： df_3 = df.fillna(df.median()) print(df_3) print("-" * 10) df_3.rename({3:'各个列的中位数'},axis=0,inplace=True) #修改一个行标题 print(df_3) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN NaN ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 315.5 341.5 ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 各个列的总和 315.5 341.5 ---------- ---------- 语文成绩数学成绩 0 111.000000 106.000000 1 105.000000 120.000000 2 99.500000 115.500000 3 105.166667 113.833333 ---------- 语文成绩数学成绩 0 111.000000 106.000000 1 105.000000 120.000000 2 99.500000 115.500000 各个列的平均值 105.166667 113.833333 ---------- ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 105.0 115.5 ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 各个列的中位数 105.0 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,2,3]) #重新设置索引 print(df) print("-" * 10) ## 只把“数学成绩”那一列的缺失值使用该列的总和值进行填充： df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].sum()) print(df) print("-" * 10) df.rename({3:'“数学成绩”那一列的总和'},axis=0,inplace=True) #修改一个行标题 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN NaN ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN 341.5 ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 “数学成绩”那一列的总和 NaN 341.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['zhuohua','Jacky','李大杰']) #重新设置索引 print(df) 脚本运行的结果：（这里重新设置了各个行的位置） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级 zhuohua 99.5 115 130 三年二班 Jacky 105.0 88 120 三年二班李大杰 111.0 106 109 三年一班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df_1 = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value=8) #重新设置索引，并把所有列的缺失值都填充为数值“8” print(df_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级 mr001 8.0 8 8 8 李大杰 111.0 106 109 三年一班 mr003 8.0 8 8 8 zhuohua 99.5 115 130 三年二班 Jacky 105.0 88 120 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky']) #重新设置索引 print(df) print("-" * 10) df['数学成绩'] = df['数学成绩'].fillna(1) #只把“数学成绩”那一列的缺失值填充为数值“1” print(df) print("-" * 10) df['英语成绩'] = df['英语成绩'].fillna(2) #再把“英语成绩”那一列的缺失值填充为数值“2” print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级 mr001 NaN NaN NaN NaN 李大杰 111.0 106.0 109.0 三年一班 mr003 NaN NaN NaN NaN zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 ---------- 语文成绩数学成绩英语成绩班级 mr001 NaN 1.0 NaN NaN 李大杰 111.0 106.0 109.0 三年一班 mr003 NaN 1.0 NaN NaN zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 ---------- 语文成绩数学成绩英语成绩班级 mr001 NaN 1.0 2.0 NaN 李大杰 111.0 106.0 109.0 三年一班 mr003 NaN 1.0 2.0 NaN zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value='空值') #重新设置索引，并把所有列的缺失值都填充为字符串“空值” print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级 mr001 空值空值空值空值李大杰 111 106 109 三年一班 mr003 空值空值空值空值 zhuohua 99.5 115 130 三年二班 Jacky 105 88 120 三年二班 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最大值']) #重新设置索引 print(df) print("-" * 10) ## 把“数学成绩”那一列的缺失值使用该列的最大值进行填充： df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].max()) ## 把“班级”那一列的缺失值填充为字符串“最大值”： df['班级'] = df['班级'].fillna('最大值') print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班各个列的最大值 NaN NaN NaN NaN ---------- 语文成绩数学成绩英语成绩班级李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班各个列的最大值 NaN 115.0 NaN 最大值 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最小值']) #重新设置索引 print(df) print("-" * 10) ## 把“数学成绩”那一列的缺失值使用该列的最小值进行填充： df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].min()) ## 把“班级”那一列的缺失值填充为字符串“最小值”： df['班级'] = df['班级'].fillna('最小值') print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班各个列的最小值 NaN NaN NaN NaN ---------- 语文成绩数学成绩英语成绩班级李大杰 111.0 106.0 109.0 三年一班 zhuohua 99.5 115.0 130.0 三年二班 Jacky 105.0 88.0 120.0 三年二班各个列的最小值 NaN 88.0 NaN 最小值 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df_1 = df.reindex(columns=['班级','数学成绩','英语成绩','语文成绩']) #重新设置列 print(df_1) print("-" * 10) df_1.rename(columns={'英语成绩':'英语成绩（New）'},inplace=True) #修改一个列标题 print(df_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级数学成绩英语成绩语文成绩李大杰三年一班 106 109 111.0 Jacky 三年二班 88 120 105.0 zhuohua 三年二班 115 130 99.5 ---------- 班级数学成绩英语成绩（New）语文成绩李大杰三年一班 106 109 111.0 Jacky 三年二班 88 120 105.0 zhuohua 三年二班 115 130 99.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 重新设置列，并把所有列的缺失值都填充为数值“8”： df_1 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8) print(df_1) print("-" * 10) ## 重新设置列，并把所有列的缺失值都填充为字符串“空值”： df_2 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值') print(df_2) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- mr001 班级数学成绩英语成绩物理成绩语文成绩李大杰 8 三年一班 106 109 8 111.0 Jacky 8 三年二班 88 120 8 105.0 zhuohua 8 三年二班 115 130 8 99.5 ---------- mr001 班级数学成绩英语成绩物理成绩语文成绩李大杰空值三年一班 106 109 空值 111.0 Jacky 空值三年二班 88 120 空值 105.0 zhuohua 空值三年二班 115 130 空值 99.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置列 print(df) print("-" * 10) df['物理成绩'] = df['物理成绩'].fillna(8) #只把“物理成绩”那一列的缺失值填充为数值“8” print(df) print("-" * 10) df['mr001'] = df['mr001'].fillna('空值') #再把“mr001”那一列的缺失值填充为字符串“空值” print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- mr001 班级数学成绩英语成绩物理成绩语文成绩李大杰 NaN 三年一班 106 109 NaN 111.0 Jacky NaN 三年二班 88 120 NaN 105.0 zhuohua NaN 三年二班 115 130 NaN 99.5 ---------- mr001 班级数学成绩英语成绩物理成绩语文成绩李大杰 NaN 三年一班 106 109 8.0 111.0 Jacky NaN 三年二班 88 120 8.0 105.0 zhuohua NaN 三年二班 115 130 8.0 99.5 ---------- mr001 班级数学成绩英语成绩物理成绩语文成绩李大杰空值三年一班 106 109 8.0 111.0 Jacky 空值三年二班 88 120 8.0 105.0 zhuohua 空值三年二班 115 130 8.0 99.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级'] Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.set_index(['姓名']) #设置指定列的数据为索引 print(df) print("-" * 10) df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列 print(df) print("-" * 10) df['各位同学的总成绩'] = df.sum(axis=1) #按行求和 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 姓名语文成绩数学成绩英语成绩班级 0 李大杰 111.0 106 109 三年一班 1 Jacky 105.0 106 119 三年二班 2 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级姓名李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- 语文成绩数学成绩英语成绩姓名李大杰 111.0 106 109 Jacky 105.0 106 119 zhuohua 99.5 115 130 ---------- 语文成绩数学成绩英语成绩各位同学的总成绩姓名李大杰 111.0 106 109 326.0 Jacky 105.0 106 119 330.0 zhuohua 99.5 115 130 344.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_index = ['李大杰','Jacky','zhuohua'] Key_columns = ['语文成绩','数学成绩','英语成绩','班级'] Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列 print(df) print("-" * 10) df['各位同学的平均成绩'] = df.mean(axis=1) #按行求平均值 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩李大杰 111.0 106 109 Jacky 105.0 106 119 zhuohua 99.5 115 130 ---------- 语文成绩数学成绩英语成绩各位同学的平均成绩李大杰 111.0 106 109 108.666667 Jacky 105.0 106 119 110.000000 zhuohua 99.5 115 130 114.833333 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df_1 = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置索引、列 print(df_1) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级数学成绩英语成绩物理成绩语文成绩 mr001 NaN NaN NaN NaN NaN 李大杰三年一班 106.0 109.0 NaN 111.0 mr003 NaN NaN NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 重新设置索引、列，并把所有列的缺失值都填充为数值“8”： df_1 = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8) print(df_1) print("-" * 10) ## 重新设置引、列，并把所有列的缺失值都填充为字符串“空值”： df_2 = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值') print(df_2) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级数学成绩英语成绩物理成绩语文成绩 mr001 8 8 8 8 8.0 李大杰三年一班 106 109 8 111.0 mr003 8 8 8 8 8.0 zhuohua 三年二班 115 130 8 99.5 Jacky 三年二班 88 120 8 105.0 ---------- 班级数学成绩英语成绩物理成绩语文成绩 mr001 空值空值空值空值空值李大杰三年一班 106 109 空值 111 mr003 空值空值空值空值空值 zhuohua 三年二班 115 130 空值 99.5 Jacky 三年二班 88 120 空值 105 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) ## 重新设置索引、列： df = df.reindex( index=['mr001','李大杰','mr003','zhuohua','Jacky'], columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩']) print(df) print("-" * 10) ## 只把“数学成绩”那一列的缺失值填充为数值“1”： df['数学成绩'] = df['数学成绩'].fillna(1) print(df) print("-" * 10) ## 再把“班级”那一列的缺失值填充为字符串“空值”： df['班级'] = df['班级'].fillna('空值') print(df) print("-" * 10) ## 再修改“mr003”的“英语成绩”为 100 ： df.loc['mr003','英语成绩'] = 100 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 班级数学成绩英语成绩物理成绩语文成绩 mr001 NaN NaN NaN NaN NaN 李大杰三年一班 106.0 109.0 NaN 111.0 mr003 NaN NaN NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 ---------- 班级数学成绩英语成绩物理成绩语文成绩 mr001 NaN 1.0 NaN NaN NaN 李大杰三年一班 106.0 109.0 NaN 111.0 mr003 NaN 1.0 NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 ---------- 班级数学成绩英语成绩物理成绩语文成绩 mr001 空值 1.0 NaN NaN NaN 李大杰三年一班 106.0 109.0 NaN 111.0 mr003 空值 1.0 NaN NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 ---------- 班级数学成绩英语成绩物理成绩语文成绩 mr001 空值 1.0 NaN NaN NaN 李大杰三年一班 106.0 109.0 NaN 111.0 mr003 空值 1.0 100.0 NaN NaN zhuohua 三年二班 115.0 130.0 NaN 99.5 Jacky 三年二班 88.0 120.0 NaN 105.0 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([1,3,0,5,2]) #重新设置索引 print(df) print("-" * 10) ## 再修改索引为数值“3”的“数学成绩”为 100 ： df.loc[3,'数学成绩'] = 100 print(df) print("-" * 10) ## 删除含有缺失值的行数据：（针对所有的列） df = df.dropna() print(df) print("-" * 10) ## 删除旧索引后，重新设置索引：（索引默认从0开始） df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN NaN 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩数学成绩 1 105.0 120.0 3 NaN 100.0 0 111.0 106.0 5 NaN NaN 2 99.5 115.5 ---------- 语文成绩数学成绩 1 105.0 120.0 0 111.0 106.0 2 99.5 115.5 ---------- 语文成绩数学成绩 0 105.0 120.0 1 111.0 106.0 2 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) ## 删除含有缺失值的行数据：（针对所有的列） df = df.dropna() print(df) print("-" * 10) ## 删除旧索引后，重新设置索引：（索引默认从0开始） df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py zhuohua的三次考试成绩语文成绩数学成绩 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- ---------- zhuohua的三次考试成绩数学成绩语文成绩语文成绩的升降情况 0 第一次 106.0 111.0 NaN 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- zhuohua的三次考试成绩数学成绩语文成绩语文成绩的升降情况 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- zhuohua的三次考试成绩数学成绩语文成绩语文成绩的升降情况 0 第二次 120.0 105.0 -6.0 1 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：') df = df[df['语文成绩的升降情况'].notnull()] print(df) print("-" * 10) ## 删除旧索引后，重新设置索引：（索引默认从0开始） df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py zhuohua的三次考试成绩语文成绩数学成绩 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- ---------- zhuohua的三次考试成绩数学成绩语文成绩语文成绩的升降情况 0 第一次 106.0 111.0 NaN 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中不含有缺失值的行数据： zhuohua的三次考试成绩数学成绩语文成绩语文成绩的升降情况 1 第二次 120.0 105.0 -6.0 2 第三次 115.5 99.5 -5.5 ---------- zhuohua的三次考试成绩数学成绩语文成绩语文成绩的升降情况 0 第二次 120.0 105.0 -6.0 1 第三次 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[1,2,3]) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) print("-" * 10) print("-" * 10) df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位 ## 重新设置各个列的位置： df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况']) print(df) print("-" * 10) print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：') df = df[df['语文成绩的升降情况'].notnull()] print(df) print("-" * 10) ## 删除旧索引后，重新设置索引：（索引默认从0开始） df = df.dropna().reset_index(drop=True) print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- 数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第一次 106.0 111.0 NaN 第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：数学成绩语文成绩语文成绩的升降情况 zhuohua的三次考试成绩第二次 120.0 105.0 -6.0 第三次 115.5 99.5 -5.5 ---------- 数学成绩语文成绩语文成绩的升降情况 0 120.0 105.0 -6.0 1 115.5 99.5 -5.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,88,115], '英语成绩':[109,120,130], '班级':['三年一班','三年二班','三年二班'] }, index=['李大杰','Jacky','zhuohua']) print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩英语成绩班级李大杰 111.0 106 109 三年一班 Jacky 105.0 88 120 三年二班 zhuohua 99.5 115 130 三年二班 ---------- ---------- 李大杰语文成绩 111 数学成绩 106 英语成绩 109 班级三年一班 Jacky 语文成绩 105 数学成绩 88 英语成绩 120 班级三年二班 zhuohua 语文成绩 99.5 数学成绩 115 英语成绩 130 班级三年二班 dtype: object C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }) print(df) print("-" * 10) print("-" * 10) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 姓名语文成绩数学成绩班级 0 李大杰 111.0 106.0 三年一班 1 Jacky 105.0 120.0 三年二班 2 zhuohua 99.5 115.5 三年一班 ---------- ---------- 语文成绩数学成绩班级姓名三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 三年一班 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) print(df) print("-" * 10) print("-" * 10) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 姓名语文成绩数学成绩班级 0 李大杰 111.0 106.0 三年一班 1 Jacky 105.0 120.0 三年二班 2 zhuohua 99.5 115.5 三年二班 ---------- ---------- 语文成绩数学成绩班级姓名三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引 print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩班级姓名三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 三年一班 zhuohua 99.5 115.5 ---------- ---------- 班级姓名三年一班李大杰语文成绩 111.0 数学成绩 106.0 三年二班 Jacky 语文成绩 105.0 数学成绩 120.0 三年一班 zhuohua 语文成绩 99.5 数学成绩 115.5 dtype: float64 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引 print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩班级姓名三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 ---------- ---------- 班级姓名三年一班李大杰语文成绩 111.0 数学成绩 106.0 三年二班 Jacky 语文成绩 105.0 数学成绩 120.0 zhuohua 语文成绩 99.5 数学成绩 115.5 dtype: float64 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引 print(df) print("-" * 10) print("-" * 10) df = df.stack() #把所有列转换为行 print(df) print("-" * 10) print("-" * 10) df = df.unstack() #把所有行转换为列 print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩班级姓名三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 ---------- ---------- 班级姓名三年一班李大杰语文成绩 111.0 数学成绩 106.0 三年二班 Jacky 语文成绩 105.0 数学成绩 120.0 zhuohua 语文成绩 99.5 数学成绩 115.5 dtype: float64 ---------- ---------- 语文成绩数学成绩班级姓名三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }) print(df) print("-" * 10) print("-" * 10) print("输出各个班级的学生的语文成绩：") ## 以“姓名”那一列的数据为行，以“班级”那一列的数据为列，以“语文成绩”那一列的数据为填充值： df = df.pivot(index='姓名',columns='班级',values='语文成绩') print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 姓名语文成绩数学成绩班级 0 李大杰 111.0 106.0 三年一班 1 Jacky 105.0 120.0 三年二班 2 zhuohua 99.5 115.5 三年一班 ---------- ---------- 输出各个班级的学生的语文成绩：班级三年一班三年二班姓名 Jacky NaN 105.0 zhuohua 99.5 NaN 李大杰 111.0 NaN C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年一班'] }, index=[1,2,3]) print(df) print("-" * 10) print("-" * 10) print("输出各个班级的学生的数学成绩：") ## 以“姓名”那一列的数据为行，以“班级”那一列的数据为列，以“数学成绩”那一列的数据为填充值： df = df.pivot(index='姓名',columns='班级',values='数学成绩') print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 姓名语文成绩数学成绩班级 1 李大杰 111.0 106.0 三年一班 2 Jacky 105.0 120.0 三年二班 3 zhuohua 99.5 115.5 三年一班 ---------- ---------- 输出各个班级的学生的数学成绩：班级三年一班三年二班姓名 Jacky NaN 120.0 zhuohua 115.5 NaN 李大杰 106.0 NaN C:\Users\jacky\Desktop> Pandas的导出和导入（html文件）： Win7连接公网安装第三方库（lxml）： C:\Users\jacky\Desktop>pip3 install lxml==4.9.3 -i http://mirrors.aliyun.com/pypi/simple --trusted-host=mirrors.aliyun.com 第三方库（lxml）安装成功： C:\Users\jacky\Desktop>pip3 freeze lxml==4.9.3 numpy==1.19.5 pandas==1.1.5 python-dateutil==2.8.2 pytz==2023.3 six==1.16.0 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) ## 把结果分别导出到指定的html文件： df.to_html('C:\\Users\\jacky\\Desktop\\mybook_1.html',index=False,header=True) #不保留索引（行标题），但保留列标题 df.to_html('C:/Users/jacky/Desktop/mybook_2.html',index=False,header=False) #不保留索引（行标题）、列标题 df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引（行标题）、列标题脚本运行的结果：（假如目标文件存在则覆盖，不存在则自动创建） C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件 print(df) print(type(df)) print("-" * 10) print("-" * 10) print(df[0]) print("-" * 10) ## 修改一个列标题： df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True) print(df[0]) print("-" * 10) ## 修改多个列标题： df[0].rename(columns={'Unnamed: 1_level_1':'语文','Unnamed: 2_level_1':None},inplace=True) print(df[0]) print("-" * 10) ## 不输出索引： df[0] = df[0].to_string(index=False) print(df[0]) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py [ Unnamed: 0_level_0 语文成绩数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5] ---------- ---------- Unnamed: 0_level_0 语文成绩数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩语文成绩数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩语文成绩数学成绩 zhuohua的三次考试成绩语文 NaN 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩语文成绩数学成绩 zhuohua的三次考试成绩语文 NaN 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd def func1(): #自定义导出的函数 pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { 'zhuohua的三次考试成绩':['第一次','第二次','第三次'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }) df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引 print(df) ## 把结果导出到指定的html文件： df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引（行标题）、列标题 print("-" * 10) print("-" * 10) print("-" * 10) func2() #执行func2() def func2(): #自定义导入的函数 pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件 print(df) print(type(df)) print("-" * 10) print("-" * 10) print(df[0]) print("-" * 10) ## 修改一个列标题： df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True) ## 修改多个列标题： df[0].rename(columns={'Unnamed: 1_level_1':0,'Unnamed: 2_level_1':0},inplace=True) print(df[0]) print("-" * 10) ## 不输出索引： df[0] = df[0].to_string(index=False) print(df[0]) if __name__ == '__main__': func1() #执行func1() 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 zhuohua的三次考试成绩第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 ---------- ---------- ---------- [ Unnamed: 0_level_0 语文成绩数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5] ---------- ---------- Unnamed: 0_level_0 语文成绩数学成绩 zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩语文成绩数学成绩 zhuohua的三次考试成绩 0 0 0 第一次 111.0 106.0 1 第二次 105.0 120.0 2 第三次 99.5 115.5 ---------- 姓名+历次成绩语文成绩数学成绩 zhuohua的三次考试成绩 0 0 第一次 111.0 106.0 第二次 105.0 120.0 第三次 99.5 115.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd def func1(): #自定义导出的函数 pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df = pd.DataFrame( { '姓名':['李大杰','Jacky','zhuohua'], '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], '班级':['三年一班','三年二班','三年二班'] }) df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引 print(df) ## 把结果导出到指定的html文件： df.to_html('d:/share/mybook_4.html',index=True,header=True) #保留索引（行标题）、列标题 def func2(): #自定义导入的函数 pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:\\share\\mybook_4.html',encoding='utf-8') #导入指定的html文件 print(df) print(type(df)) print("-" * 10) print("-" * 10) print(df[0]) print("-" * 10) ## 修改多个列标题： df[0].rename(columns={'Unnamed: 0_level_0':0,'Unnamed: 1_level_0':None},inplace=True) ## 修改多个列标题： df[0].rename(columns={'Unnamed: 2_level_1':None,'Unnamed: 3_level_1':'B'},inplace=True) print(df[0]) print("-" * 10) ## 不输出索引： df[0] = df[0].to_string(index=False) print(df[0]) if __name__ == '__main__': func1() #执行func1() print("-" * 10) print("-" * 10) print("-" * 10) func2() #执行func2() 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩班级姓名三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 zhuohua 99.5 115.5 ---------- ---------- ---------- [ Unnamed: 0_level_0 Unnamed: 1_level_0 语文成绩数学成绩班级姓名 Unnamed: 2_level_1 Unnamed: 3_level_1 0 三年一班李大杰 111.0 106.0 1 三年二班 Jacky 105.0 120.0 2 三年二班 zhuohua 99.5 115.5] ---------- ---------- Unnamed: 0_level_0 Unnamed: 1_level_0 语文成绩数学成绩班级姓名 Unnamed: 2_level_1 Unnamed: 3_level_1 0 三年一班李大杰 111.0 106.0 1 三年二班 Jacky 105.0 120.0 2 三年二班 zhuohua 99.5 115.5 ---------- 0 NaN 语文成绩数学成绩班级姓名 NaN B 0 三年一班李大杰 111.0 106.0 1 三年二班 Jacky 105.0 120.0 2 三年二班 zhuohua 99.5 115.5 ---------- 0 NaN 语文成绩数学成绩班级姓名 NaN B 三年一班李大杰 111.0 106.0 三年二班 Jacky 105.0 120.0 三年二班 zhuohua 99.5 115.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) #使用字典创建DataFrame数据 df=pd.DataFrame( { '语文成绩':[111,105,99.5], '数学成绩':[106,120,115.5], }, index=[0,1,2]) print(df) print("-" * 10) print("-" * 10) df = df.reindex([0,1,2,3]) #重新设置索引 print(df) print("-" * 10) ## 所有列的缺失值都使用各个列的总和值进行填充： df = df.fillna(df.sum()) print(df) print("-" * 10) df.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题 print(df) print("-" * 3) df.rename({0:'李大杰',1:'Jacky',2:'zhuohua'},axis=0,inplace=True) #修改多个行标题 print(df) ## 把结果导出到指定的html文件： df.to_html('D:/mybook_5.html',index=True,header=True) #保留索引（行标题）、列标题 print("-" * 10) print("-" * 10) print("-" * 10) Result_2 = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件 print(Result_2) print("-" * 3) print(Result_2[0]) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 ---------- ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 NaN NaN ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 3 315.5 341.5 ---------- 语文成绩数学成绩 0 111.0 106.0 1 105.0 120.0 2 99.5 115.5 各个列的总和 315.5 341.5 --- 语文成绩数学成绩李大杰 111.0 106.0 Jacky 105.0 120.0 zhuohua 99.5 115.5 各个列的总和 315.5 341.5 ---------- ---------- ---------- [ Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5] --- Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件 print(df) print("-" * 3) print(df[0]) print("-" * 10) print("-" * 10) ## 把结果导出到指定的txt文件： df[0].to_csv("D:/mybook_5.txt",sep='\t',index=False,header=True) #不保留索引（行标题），但保留列标题 ## 导入指定的txt文件： df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8') print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py [ Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5] --- Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 ---------- ---------- Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8') #导入指定的txt文件 print(df) print("-" * 10) print("-" * 10) ## 把结果导出到指定的html文件： df.to_html('D:/mybook_5.html',index=False,header=True) #不保留索引（行标题），但保留列标题 ## 导入指定的html文件： df = pd.read_html('D:/mybook_5.html',encoding='utf-8') print(df) print("-" * 3) print(df[0]) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 ---------- ---------- [ Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5] --- Unnamed: 0 语文成绩数学成绩 0 李大杰 111.0 106.0 1 Jacky 105.0 120.0 2 zhuohua 99.5 115.5 3 各个列的总和 315.5 341.5 C:\Users\jacky\Desktop> ###### ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级'] Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']] df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据 print(df) print("-" * 10) print("-" * 10) df = df.set_index(['姓名']) #设置指定列的数据为索引 print(df) print("-" * 10) df['各位同学的总成绩'] = df.sum(axis=1) #按行求和 print(df) print("-" * 10) df = df.reindex(columns=['班级','各位同学的总成绩']) #重新设置列 print(df) ## 把结果导出到指定的html文件： df.to_html('D:/Pandas的基础-6.html',index=True,header=True) #保留索引（行标题）、列标题 print("-" * 10) print("-" * 10) print("-" * 10) Result_2 = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件 print(Result_2) print("-" * 3) print(Result_2[0]) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py 姓名语文成绩数学成绩英语成绩班级 0 李大杰 111.0 106 109 三年一班 1 Jacky 105.0 106 119 三年二班 2 zhuohua 99.5 115 130 三年二班 ---------- ---------- 语文成绩数学成绩英语成绩班级姓名李大杰 111.0 106 109 三年一班 Jacky 105.0 106 119 三年二班 zhuohua 99.5 115 130 三年二班 ---------- 语文成绩数学成绩英语成绩班级各位同学的总成绩姓名李大杰 111.0 106 109 三年一班 326.0 Jacky 105.0 106 119 三年二班 330.0 zhuohua 99.5 115 130 三年二班 344.5 ---------- 班级各位同学的总成绩姓名李大杰三年一班 326.0 Jacky 三年二班 330.0 zhuohua 三年二班 344.5 ---------- ---------- ---------- [ Unnamed: 0_level_0 班级各位同学的总成绩姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5] --- Unnamed: 0_level_0 班级各位同学的总成绩姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件 print(df) print("-" * 3) print(df[0]) print("-" * 10) print("-" * 10) ## 把结果导出到指定的csv文件： df[0].to_csv("D:/Pandas的基础-6.csv",sep='\t',index=False,header=True) #不保留索引（行标题），但保留列标题 ## 导入指定的csv文件： df = pd.read_csv('D:/Pandas的基础-6.csv',sep='\t',encoding='utf-8') print(df) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py [ Unnamed: 0_level_0 班级各位同学的总成绩姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5] --- Unnamed: 0_level_0 班级各位同学的总成绩姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 0 李大杰三年一班 326.0 1 Jacky 三年二班 330.0 2 zhuohua 三年二班 344.5 ---------- ---------- Unnamed: 0_level_0 班级各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5 C:\Users\jacky\Desktop> ###### #coding=utf-8 import pandas as pd pd.set_option('display.unicode.east_asian_width',True) df = pd.read_csv("D:/Pandas的基础-6.csv",sep='\t',encoding='utf-8') #导入指定的csv文件 print(df) print("-" * 10) print("-" * 10) ## 把结果导出到指定的html文件： df.to_html('D:/Pandas的基础_5.html',index=False,header=True) #不保留索引（行标题），但保留列标题 ## 导入指定的html文件： df = pd.read_html('d:/Pandas的基础_5.html',encoding='utf-8') print(df) print("-" * 3) print(df[0]) 脚本运行的结果： C:\Users\jacky\Desktop>python xx.py Unnamed: 0_level_0 班级各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5 ---------- ---------- [ Unnamed: 0_level_0 班级各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5] --- Unnamed: 0_level_0 班级各位同学的总成绩 0 姓名 Unnamed: 1_level_1 Unnamed: 2_level_1 1 李大杰三年一班 326.0 2 Jacky 三年二班 330.0 3 zhuohua 三年二班 344.5 C:\Users\jacky\Desktop> 相关文章： Pandas的基础 Pandas的日期时间数据转换

欢迎光临 blog.zhuohua.store (http://blog.zhuohua.store/)