Pandas的数据清洗

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=['第一次','第二次','第三次']) #设置索引（行标题）

print(df)

print("-" * 10)
print("-" * 10)

df['数学成绩的升降情况'] = df['数学成绩'] - df['数学成绩'].shift() #数据移位

print(df)

脚本运行的结果：（NaN为缺失值）
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩
第一次    111.0    106.0
第二次    105.0    120.0
第三次    99.5    115.5
----------
----------
      语文成绩  数学成绩  数学成绩的升降情况
第一次    111.0    106.0                NaN
第二次    105.0    120.0             14.0
第三次    99.5    115.5             -4.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据：
Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']]
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   111.0    106.0                NaN
第二次                   105.0    120.0             -6.0
第三次                   99.5    115.5             -5.5
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据：
Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']]
print(Result_1)

print("-" * 10)

## 分别判断各个值是否为NaN：（为NaN时，结果显示为True）
Result_2 = df.isnull()
print(Result_2)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   111.0    106.0                NaN
第二次                   105.0    120.0             -6.0
第三次                   99.5    115.5             -5.5
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
                     语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   False    False             True
第二次                   False    False             False
第三次                   False    False             False

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 重新设置各个列的位置：
Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   111.0    106.0                NaN
第二次                   105.0    120.0             -6.0
第三次                   99.5    115.5             -5.5
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 重新设置各个列的位置：
Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(Result_1)

## 分别判断各个值是否为NaN：（为NaN时，结果显示为False）
Result_2 = df.notnull()
print(Result_2)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   111.0    106.0                NaN
第二次                   105.0    120.0             -6.0
第三次                   99.5    115.5             -5.5
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
                     语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   True    True             False
第二次                   True    True             True
第三次                   True    True             True

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“数学成绩”那一列中含有缺失值的行数据：')
Result_1 = df[df['数学成绩'].isnull()]
print(Result_1)

print("-" * 10)

print('输出“语文成绩”那一列中含有缺失值的行数据：')
Result_2 = df[df['语文成绩'].isnull()]
print(Result_2)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
输出“数学成绩”那一列中含有缺失值的行数据：
Empty DataFrame
Columns: [数学成绩, 语文成绩, 语文成绩的升降情况]
Index: []
----------
输出“语文成绩”那一列中含有缺失值的行数据：
Empty DataFrame
Columns: [数学成绩, 语文成绩, 语文成绩的升降情况]
Index: []

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中含有缺失值的行数据：')
Result_1 = df[df['语文成绩的升降情况'].isnull()]
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
输出“语文成绩的升降情况”那一列中含有缺失值的行数据：
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“数学成绩”那一列中不含有缺失值的行数据：')
Result_1 = df[df['数学成绩'].notnull()]
print(Result_1)

print("-" * 10)

print('输出“语文成绩”那一列中不含有缺失值的行数据：')
Result_2 = df[df['语文成绩'].notnull()]
print(Result_2)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
输出“数学成绩”那一列中不含有缺失值的行数据：
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
输出“语文成绩”那一列中不含有缺失值的行数据：
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：')
Result_1 = df[df['语文成绩的升降情况'].notnull()]
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

## 把“语文成绩的升降情况”那一列的缺失值填充为数值“0” ：
df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna(0)
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                0.0
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

## 把“语文成绩的升降情况”那一列的缺失值填充为字符串“空值（Null）” ：
df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna('空值（Null）')
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
                     数学成绩  语文成绩语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0    空值（Null）
第二次                   120.0    105.0                -6
第三次                   115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

print(df.drop_duplicates(['数学成绩'])) #去除指定列的重复数据，只保留第一行的行数据

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    106.0
第三次                   99.5    115.5
----------
----------
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第三次                   99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据，只保留第一行的行数据：
Result_1 = df.drop_duplicates(['数学成绩'],keep='first')
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    106.0
第三次                   99.5    115.5
----------
----------
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第三次                   99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据，只保留最后一行的行数据：
Result_1 = df.drop_duplicates(['数学成绩'],keep='last')
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    106.0
第三次                   99.5    115.5
----------
----------
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第二次                   105.0    106.0
第三次                   99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,119,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据，只保留最后一行的行数据：
Result_1 = df.drop_duplicates(['班级'],keep='last')
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    119  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
zhuohua    99.5    115    130  三年二班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115],
'英语成绩':[109,119,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据，不保留其行数据：
Result_1 = df.drop_duplicates(['数学成绩'],keep=False)
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0    106    119  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
zhuohua    99.5    115    130  三年二班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115],
'英语成绩':[109,119,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据，不保留其行数据：
Result_1 = df.drop_duplicates(['班级'],keep=False)
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0    106    119  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_index = ['李大杰','Jacky','zhuohua']

Key_columns = ['语文成绩','数学成绩','英语成绩','班级']

Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据，不保留其行数据：
Result_1 = df.drop_duplicates(['班级'],keep=False)
print(Result_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0    106    119  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_columns = ['语文成绩','数学成绩','英语成绩','班级']

Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,2,0]) #重新设置索引

print(df)

脚本运行的结果：（这里重新设置了各个行的位置）
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩  英语成绩    班级
0    111.0    106    109  三年一班
1    105.0    106    119  三年二班
2    99.5    115    130  三年二班
----------
----------
语文成绩  数学成绩  英语成绩    班级
1    105.0    106    119  三年二班
2    99.5    115    130  三年二班
0    111.0    106    109  三年一班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
})

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,2,0]) #重新设置索引

print(df)

脚本运行的结果：（这里重新设置了各个行的位置）
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
2    99.5    115.5
0    111.0    106.0

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2]) #重新设置索引

print(df)

脚本运行的结果：（NaN为缺失值）
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    NaN
0    111.0    106.0
5    NaN    NaN
2    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,2,3,4,5]) #重新设置索引

print(df)

脚本运行的结果：（索引为数值“0”的那行数据没有出现了）
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
2    99.5    115.5
3    NaN    NaN
4    NaN    NaN
5    NaN    NaN

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,4,5,2],fill_value=0) #重新设置索引，并把所有列的缺失值都填充为数值“0”

print(df)

脚本运行的结果：（索引为数值“0”的那行数据没有出现了）
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
3    0.0    0.0
4    0.0    0.0
5    0.0    0.0
2    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,3,4,5,2]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna(0) #只把“数学成绩”那一列的缺失值填充为数值“0”

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
3    NaN    NaN
4    NaN    NaN
5    NaN    NaN
2    99.5    115.5
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
3    NaN    0.0
4    NaN    0.0
5    NaN    0.0
2    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,4,5,2],fill_value='(空值（Null）') #重新设置索引，并把所有列的缺失值填充为字符串“(空值（Null）”

print(df)

脚本运行的结果：（索引为数值“0”的那行数据没有出现了）
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
      语文成绩    数学成绩
1          105          120
3  (空值（Null）  (空值（Null）
4  (空值（Null）  (空值（Null）
5  (空值（Null）  (空值（Null）
2          99.5       115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,3,4,5,2]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna('空值') #只把“数学成绩”那一列的缺失值填充为字符串“空值”

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
3    NaN    NaN
4    NaN    NaN
5    NaN    NaN
2    99.5    115.5
----------
语文成绩数学成绩
0    111.0    106
1    105.0    120
3    NaN    空值
4    NaN    空值
5    NaN    空值
2    99.5 115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df = df.fillna(method='ffill') #所有列的缺失值都使用前一个非缺失值进行填充（和上面的一个数据一样）

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    NaN
0    111.0    106.0
5    NaN    NaN
2    99.5    115.5
4    NaN    NaN
6    NaN    NaN
----------
语文成绩  数学成绩
1    105.0    120.0
3    105.0    120.0
0    111.0    106.0
5    111.0    106.0
2    99.5    115.5
4    99.5    115.5
6    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna(method='ffill') #只把“数学成绩”那一列的缺失值使用前一个非缺失值进行填充

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    NaN
0    111.0    106.0
5    NaN    NaN
2    99.5    115.5
4    NaN    NaN
6    NaN    NaN
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    120.0
0    111.0    106.0
5    NaN    106.0
2    99.5    115.5
4    NaN    115.5
6    NaN    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df = df.fillna(method='bfill') #所有列的缺失值都使用后一个非缺失值进行填充（和下面的一个数据一样）

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    NaN
0    111.0    106.0
5    NaN    NaN
2    99.5    115.5
4    NaN    NaN
6    NaN    NaN
----------
语文成绩  数学成绩
1    105.0    120.0
3    111.0    106.0
0    111.0    106.0
5    99.5    115.5
2    99.5    115.5
4    NaN    NaN
6    NaN    NaN

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna(method='bfill') #只把“数学成绩”那一列的缺失值使用后一个非缺失值进行填充

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    NaN
0    111.0    106.0
5    NaN    NaN
2    99.5    115.5
4    NaN    NaN
6    NaN    NaN
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    106.0
0    111.0    106.0
5    NaN    115.5
2    99.5    115.5
4    NaN    NaN
6    NaN    NaN

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,2,3]) #重新设置索引
print(df)

print("-" * 10)

## 所有列的缺失值都使用各个列的总和值进行填充：
df_1 = df.fillna(df.sum())
print(df_1)

print("-" * 10)

df_1.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题
print(df_1)

print("-" * 10)
print("-" * 10)

## 所有列的缺失值都使用各个列的平均值进行填充：
df_2 = df.fillna(df.mean())
print(df_2)

print("-" * 10)

df_2.rename({3:'各个列的平均值'},axis=0,inplace=True) #修改一个行标题
print(df_2)

print("-" * 10)
print("-" * 10)

## 所有列的缺失值都使用各个列的中位数进行填充：
df_3 = df.fillna(df.median())
print(df_3)

print("-" * 10)

df_3.rename({3:'各个列的中位数'},axis=0,inplace=True) #修改一个行标题
print(df_3)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
3    NaN    NaN
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
3    315.5    341.5
----------
            语文成绩  数学成绩
0             111.0    106.0
1             105.0    120.0
2                99.5    115.5
各个列的总和    315.5    341.5
----------
----------
   语文成绩数学成绩
0  111.000000  106.000000
1  105.000000  120.000000
2 99.500000  115.500000
3  105.166667  113.833333
----------
               语文成绩数学成绩
0             111.000000  106.000000
1             105.000000  120.000000
2             99.500000  115.500000
各个列的平均值  105.166667  113.833333
----------
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
3    105.0    115.5
----------
            语文成绩  数学成绩
0                111.0    106.0
1                105.0    120.0
2                99.5    115.5
各个列的中位数    105.0    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,2,3]) #重新设置索引
print(df)

print("-" * 10)

## 只把“数学成绩”那一列的缺失值使用该列的总和值进行填充：
df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].sum())
print(df)

print("-" * 10)

df.rename({3:'“数学成绩”那一列的总和'},axis=0,inplace=True) #修改一个行标题
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
3    NaN    NaN
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
3    NaN    341.5
----------
                     语文成绩  数学成绩
0                         111.0    106.0
1                         105.0    120.0
2                         99.5    115.5
“数学成绩”那一列的总和    NaN    341.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['zhuohua','Jacky','李大杰']) #重新设置索引

print(df)

脚本运行的结果：（这里重新设置了各个行的位置）
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
zhuohua    99.5    115    130  三年二班
Jacky    105.0       88    120  三年二班
李大杰    111.0    106    109  三年一班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df_1 = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value=8) #重新设置索引，并把所有列的缺失值都填充为数值“8”

print(df_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
mr001       8.0       8       8       8
李大杰    111.0    106    109  三年一班
mr003       8.0       8       8       8
zhuohua    99.5    115    130  三年二班
Jacky    105.0       88    120  三年二班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky']) #重新设置索引
print(df)

print("-" * 10)
df['数学成绩'] = df['数学成绩'].fillna(1) #只把“数学成绩”那一列的缺失值填充为数值“1”
print(df)

print("-" * 10)
df['英语成绩'] = df['英语成绩'].fillna(2) #再把“英语成绩”那一列的缺失值填充为数值“2”
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
mr001       NaN    NaN    NaN    NaN
李大杰    111.0    106.0    109.0  三年一班
mr003       NaN    NaN    NaN    NaN
zhuohua    99.5    115.0    130.0  三年二班
Jacky    105.0    88.0    120.0  三年二班
----------
      语文成绩  数学成绩  英语成绩    班级
mr001       NaN    1.0    NaN    NaN
李大杰    111.0    106.0    109.0  三年一班
mr003       NaN    1.0    NaN    NaN
zhuohua    99.5    115.0    130.0  三年二班
Jacky    105.0    88.0    120.0  三年二班
----------
      语文成绩  数学成绩  英语成绩    班级
mr001       NaN    1.0    2.0    NaN
李大杰    111.0    106.0    109.0  三年一班
mr003       NaN    1.0    2.0    NaN
zhuohua    99.5    115.0    130.0  三年二班
Jacky    105.0    88.0    120.0  三年二班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value='空值') #重新设置索引，并把所有列的缺失值都填充为字符串“空值”

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩数学成绩英语成绩    班级
mr001    空值    空值    空值    空值
李大杰    111    106    109  三年一班
mr003    空值    空值    空值    空值
zhuohua    99.5    115    130  三年二班
Jacky       105    88    120  三年二班

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最大值']) #重新设置索引
print(df)

print("-" * 10)

## 把“数学成绩”那一列的缺失值使用该列的最大值进行填充：
df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].max())

## 把“班级”那一列的缺失值填充为字符串“最大值”：
df['班级'] = df['班级'].fillna('最大值')

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
            语文成绩  数学成绩  英语成绩    班级
李大杰          111.0    106.0    109.0  三年一班
zhuohua          99.5    115.0    130.0  三年二班
Jacky             105.0    88.0    120.0  三年二班
各个列的最大值    NaN    NaN    NaN    NaN
----------
            语文成绩  数学成绩  英语成绩    班级
李大杰          111.0    106.0    109.0  三年一班
zhuohua          99.5    115.0    130.0  三年二班
Jacky             105.0    88.0    120.0  三年二班
各个列的最大值    NaN    115.0    NaN 最大值

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最小值']) #重新设置索引
print(df)

print("-" * 10)

## 把“数学成绩”那一列的缺失值使用该列的最小值进行填充：
df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].min())

## 把“班级”那一列的缺失值填充为字符串“最小值”：
df['班级'] = df['班级'].fillna('最小值')

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
            语文成绩  数学成绩  英语成绩    班级
李大杰          111.0    106.0    109.0  三年一班
zhuohua          99.5    115.0    130.0  三年二班
Jacky             105.0    88.0    120.0  三年二班
各个列的最小值    NaN    NaN    NaN    NaN
----------
            语文成绩  数学成绩  英语成绩    班级
李大杰          111.0    106.0    109.0  三年一班
zhuohua          99.5    115.0    130.0  三年二班
Jacky             105.0    88.0    120.0  三年二班
各个列的最小值    NaN    88.0    NaN 最小值

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df_1 = df.reindex(columns=['班级','数学成绩','英语成绩','语文成绩']) #重新设置列
print(df_1)

print("-" * 10)

df_1.rename(columns={'英语成绩':'英语成绩（New）'},inplace=True) #修改一个列标题
print(df_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
         班级  数学成绩  英语成绩  语文成绩
李大杰三年一班    106    109    111.0
Jacky 三年二班       88    120    105.0
zhuohua  三年二班    115    130    99.5
----------
         班级  数学成绩  英语成绩（New）  语文成绩
李大杰三年一班    106             109    111.0
Jacky 三年二班       88             120    105.0
zhuohua  三年二班    115             130    99.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 重新设置列，并把所有列的缺失值都填充为数值“8”：
df_1 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8)
print(df_1)

print("-" * 10)

## 重新设置列，并把所有列的缺失值都填充为字符串“空值”：
df_2 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值')
print(df_2)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      mr001    班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰    8  三年一班    106    109       8    111.0
Jacky       8  三年二班       88    120       8    105.0
zhuohua    8  三年二班    115    130       8    99.5
----------
      mr001    班级  数学成绩  英语成绩物理成绩  语文成绩
李大杰空值  三年一班    106    109    空值    111.0
Jacky 空值  三年二班       88    120    空值    105.0
zhuohua  空值  三年二班    115    130    空值    99.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置列
print(df)

print("-" * 10)
df['物理成绩'] = df['物理成绩'].fillna(8) #只把“物理成绩”那一列的缺失值填充为数值“8”
print(df)

print("-" * 10)
df['mr001'] = df['mr001'].fillna('空值') #再把“mr001”那一列的缺失值填充为字符串“空值”
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      mr001    班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰    NaN  三年一班    106    109    NaN    111.0
Jacky    NaN  三年二班       88    120    NaN    105.0
zhuohua NaN  三年二班    115    130    NaN    99.5
----------
      mr001    班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰    NaN  三年一班    106    109    8.0    111.0
Jacky    NaN  三年二班       88    120    8.0    105.0
zhuohua NaN  三年二班    115    130    8.0    99.5
----------
      mr001    班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰空值  三年一班    106    109    8.0    111.0
Jacky 空值  三年二班       88    120    8.0    105.0
zhuohua  空值  三年二班    115    130    8.0    99.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级']

Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['姓名']) #设置指定列的数据为索引
print(df)

print("-" * 10)

df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列
print(df)

print("-" * 10)

df['各位同学的总成绩'] = df.sum(axis=1) #按行求和
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
   姓名  语文成绩  数学成绩  英语成绩    班级
0 李大杰    111.0    106    109  三年一班
1 Jacky    105.0    106    119  三年二班
2  zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
姓名
李大杰    111.0    106    109  三年一班
Jacky    105.0    106    119  三年二班
zhuohua    99.5    115    130  三年二班
----------
      语文成绩  数学成绩  英语成绩
姓名
李大杰    111.0    106    109
Jacky    105.0    106    119
zhuohua    99.5    115    130
----------
      语文成绩  数学成绩  英语成绩  各位同学的总成绩
姓名
李大杰    111.0    106    109          326.0
Jacky    105.0    106    119          330.0
zhuohua    99.5    115    130          344.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_index = ['李大杰','Jacky','zhuohua']

Key_columns = ['语文成绩','数学成绩','英语成绩','班级']

Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列
print(df)

print("-" * 10)

df['各位同学的平均成绩'] = df.mean(axis=1) #按行求平均值
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0    106    119  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩
李大杰    111.0    106    109
Jacky    105.0    106    119
zhuohua    99.5    115    130
----------
      语文成绩  数学成绩  英语成绩  各位同学的平均成绩
李大杰    111.0    106    109       108.666667
Jacky    105.0    106    119       110.000000
zhuohua    99.5    115    130       114.833333

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df_1 = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置索引、列

print(df_1)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
         班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001       NaN    NaN    NaN    NaN    NaN
李大杰三年一班    106.0    109.0    NaN    111.0
mr003       NaN    NaN    NaN    NaN    NaN
zhuohua  三年二班    115.0    130.0    NaN    99.5
Jacky 三年二班    88.0    120.0    NaN    105.0

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 重新设置索引、列，并把所有列的缺失值都填充为数值“8”：
df_1 = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8)

print(df_1)

print("-" * 10)

## 重新设置引、列，并把所有列的缺失值都填充为字符串“空值”：
df_2 = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值')

print(df_2)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
         班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001          8       8       8       8    8.0
李大杰三年一班    106    109       8    111.0
mr003          8       8       8       8    8.0
zhuohua  三年二班    115    130       8    99.5
Jacky 三年二班       88    120       8    105.0
----------
         班级数学成绩英语成绩物理成绩语文成绩
mr001       空值    空值    空值    空值    空值
李大杰三年一班    106    109    空值    111
mr003       空值    空值    空值    空值    空值
zhuohua  三年二班    115    130    空值    99.5
Jacky 三年二班    88    120    空值    105

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 重新设置索引、列：
df = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'])

print(df)

print("-" * 10)

## 只把“数学成绩”那一列的缺失值填充为数值“1”：
df['数学成绩'] = df['数学成绩'].fillna(1)
print(df)

print("-" * 10)

## 再把“班级”那一列的缺失值填充为字符串“空值”：
df['班级'] = df['班级'].fillna('空值')
print(df)

print("-" * 10)

## 再修改“mr003”的“英语成绩”为 100 ：
df.loc['mr003','英语成绩'] = 100
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
         班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001       NaN    NaN    NaN    NaN    NaN
李大杰三年一班    106.0    109.0    NaN    111.0
mr003       NaN    NaN    NaN    NaN    NaN
zhuohua  三年二班    115.0    130.0    NaN    99.5
Jacky 三年二班    88.0    120.0    NaN    105.0
----------
         班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001       NaN    1.0    NaN    NaN    NaN
李大杰三年一班    106.0    109.0    NaN    111.0
mr003       NaN    1.0    NaN    NaN    NaN
zhuohua  三年二班    115.0    130.0    NaN    99.5
Jacky 三年二班    88.0    120.0    NaN    105.0
----------
         班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001       空值    1.0    NaN    NaN    NaN
李大杰三年一班    106.0    109.0    NaN    111.0
mr003       空值    1.0    NaN    NaN    NaN
zhuohua  三年二班    115.0    130.0    NaN    99.5
Jacky 三年二班    88.0    120.0    NaN    105.0
----------
         班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001       空值    1.0    NaN    NaN    NaN
李大杰三年一班    106.0    109.0    NaN    111.0
mr003       空值    1.0    100.0    NaN    NaN
zhuohua  三年二班    115.0    130.0    NaN    99.5
Jacky 三年二班    88.0    120.0    NaN    105.0

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2]) #重新设置索引

print(df)

print("-" * 10)

## 再修改索引为数值“3”的“数学成绩”为 100 ：
df.loc[3,'数学成绩'] = 100
print(df)

print("-" * 10)

## 删除含有缺失值的行数据：（针对所有的列）
df = df.dropna()
print(df)

print("-" * 10)

## 删除旧索引后，重新设置索引：（索引默认从0开始）
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    NaN
0    111.0    106.0
5    NaN    NaN
2    99.5    115.5
----------
语文成绩  数学成绩
1    105.0    120.0
3    NaN    100.0
0    111.0    106.0
5    NaN    NaN
2    99.5    115.5
----------
语文成绩  数学成绩
1    105.0    120.0
0    111.0    106.0
2    99.5    115.5
----------
语文成绩  数学成绩
0    105.0    120.0
1    111.0    106.0
2    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

## 删除含有缺失值的行数据：（针对所有的列）
df = df.dropna()
print(df)

print("-" * 10)

## 删除旧索引后，重新设置索引：（索引默认从0开始）
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
  zhuohua的三次考试成绩  语文成绩  数学成绩
0             第一次    111.0    106.0
1             第二次    105.0    120.0
2             第三次    99.5    115.5
----------
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0             第一次    106.0    111.0                NaN
1             第二次    120.0    105.0             -6.0
2             第三次    115.5    99.5             -5.5
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
1             第二次    120.0    105.0             -6.0
2             第三次    115.5    99.5             -5.5
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0             第二次    120.0    105.0             -6.0
1             第三次    115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：')
df = df[df['语文成绩的升降情况'].notnull()]
print(df)

print("-" * 10)

## 删除旧索引后，重新设置索引：（索引默认从0开始）
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
  zhuohua的三次考试成绩  语文成绩  数学成绩
0             第一次    111.0    106.0
1             第二次    105.0    120.0
2             第三次    99.5    115.5
----------
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0             第一次    106.0    111.0                NaN
1             第二次    120.0    105.0             -6.0
2             第三次    115.5    99.5             -5.5
----------
输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
1             第二次    120.0    105.0             -6.0
2             第三次    115.5    99.5             -5.5
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0             第二次    120.0    105.0             -6.0
1             第三次    115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置：
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：')
df = df[df['语文成绩的升降情况'].notnull()]
print(df)

print("-" * 10)

## 删除旧索引后，重新设置索引：（索引默认从0开始）
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                   106.0    111.0                NaN
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
输出“语文成绩的升降情况”那一列中不含有缺失值的行数据：
                     数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第二次                   120.0    105.0             -6.0
第三次                   115.5    99.5             -5.5
----------
数学成绩  语文成绩  语文成绩的升降情况
0    120.0    105.0             -6.0
1    115.5    99.5             -5.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
      语文成绩  数学成绩  英语成绩    班级
李大杰    111.0    106    109  三年一班
Jacky    105.0       88    120  三年二班
zhuohua    99.5    115    130  三年二班
----------
----------
李大杰语文成绩       111
      数学成绩       106
      英语成绩       109
      班级       三年一班
Jacky 语文成绩       105
      数学成绩       88
      英语成绩       120
      班级       三年二班
zhuohua  语文成绩       99.5
      数学成绩       115
      英语成绩       130
      班级       三年二班
dtype: object

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
})

print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
   姓名  语文成绩  数学成绩    班级
0 李大杰    111.0    106.0  三年一班
1 Jacky    105.0    120.0  三年二班
2  zhuohua    99.5    115.5  三年一班
----------
----------
               语文成绩  数学成绩
班级    姓名
三年一班李大杰    111.0    106.0
三年二班 Jacky    105.0    120.0
三年一班 zhuohua    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年二班']
})

print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
   姓名  语文成绩  数学成绩    班级
0 李大杰    111.0    106.0  三年一班
1 Jacky    105.0    120.0  三年二班
2  zhuohua    99.5    115.5  三年二班
----------
----------
               语文成绩  数学成绩
班级    姓名
三年一班李大杰    111.0    106.0
三年二班 Jacky    105.0    120.0
      zhuohua    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
})

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
               语文成绩  数学成绩
班级    姓名
三年一班李大杰    111.0    106.0
三年二班 Jacky    105.0    120.0
三年一班 zhuohua    99.5    115.5
----------
----------
班级    姓名
三年一班  李大杰语文成绩 111.0
               数学成绩 106.0
三年二班  Jacky 语文成绩 105.0
               数学成绩 120.0
三年一班  zhuohua  语文成绩    99.5
               数学成绩 115.5
dtype: float64

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年二班']
})

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
               语文成绩  数学成绩
班级    姓名
三年一班李大杰    111.0    106.0
三年二班 Jacky    105.0    120.0
      zhuohua    99.5    115.5
----------
----------
班级    姓名
三年一班  李大杰语文成绩 111.0
               数学成绩 106.0
三年二班  Jacky 语文成绩 105.0
               数学成绩 120.0
      zhuohua  语文成绩    99.5
               数学成绩 115.5
dtype: float64

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年二班']
})

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

print("-" * 10)
print("-" * 10)

df = df.unstack() #把所有行转换为列

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
               语文成绩  数学成绩
班级    姓名
三年一班李大杰    111.0    106.0
三年二班 Jacky    105.0    120.0
      zhuohua    99.5    115.5
----------
----------
班级    姓名
三年一班  李大杰语文成绩 111.0
               数学成绩 106.0
三年二班  Jacky 语文成绩 105.0
               数学成绩 120.0
      zhuohua  语文成绩    99.5
               数学成绩 115.5
dtype: float64
----------
----------
               语文成绩  数学成绩
班级    姓名
三年一班李大杰    111.0    106.0
三年二班 Jacky    105.0    120.0
      zhuohua    99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
})

print(df)

print("-" * 10)
print("-" * 10)

print("输出各个班级的学生的语文成绩：")

## 以“姓名”那一列的数据为行，以“班级”那一列的数据为列，以“语文成绩”那一列的数据为填充值：
df = df.pivot(index='姓名',columns='班级',values='语文成绩')

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
   姓名  语文成绩  数学成绩    班级
0 李大杰    111.0    106.0  三年一班
1 Jacky    105.0    120.0  三年二班
2  zhuohua    99.5    115.5  三年一班
----------
----------
输出各个班级的学生的语文成绩：
班级    三年一班  三年二班
姓名
Jacky       NaN    105.0
zhuohua    99.5    NaN
李大杰    111.0    NaN

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
},
index=[1,2,3])

print(df)

print("-" * 10)
print("-" * 10)

print("输出各个班级的学生的数学成绩：")

## 以“姓名”那一列的数据为行，以“班级”那一列的数据为列，以“数学成绩”那一列的数据为填充值：
df = df.pivot(index='姓名',columns='班级',values='数学成绩')

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
   姓名  语文成绩  数学成绩    班级
1 李大杰    111.0    106.0  三年一班
2 Jacky    105.0    120.0  三年二班
3  zhuohua    99.5    115.5  三年一班
----------
----------
输出各个班级的学生的数学成绩：
班级    三年一班  三年二班
姓名
Jacky       NaN    120.0
zhuohua    115.5    NaN
李大杰    106.0    NaN

C:\Users\jacky\Desktop>

Pandas的导出和导入（html文件）：

Win7连接公网安装第三方库（lxml）：
C:\Users\jacky\Desktop>pip3 install lxml==4.9.3 -i http://mirrors.aliyun.com/pypi/simple --trusted-host=mirrors.aliyun.com

第三方库（lxml）安装成功：
C:\Users\jacky\Desktop>pip3 freeze
lxml==4.9.3
numpy==1.19.5
pandas==1.1.5
python-dateutil==2.8.2
pytz==2023.3
six==1.16.0

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
})

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

## 把结果分别导出到指定的html文件：
df.to_html('C:\\Users\\jacky\\Desktop\\mybook_1.html',index=False,header=True) #不保留索引（行标题），但保留列标题

df.to_html('C:/Users/jacky/Desktop/mybook_2.html',index=False,header=False) #不保留索引（行标题）、列标题

df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引（行标题）、列标题

脚本运行的结果：（假如目标文件存在则覆盖，不存在则自动创建）
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件

print(df)
print(type(df))

print("-" * 10)
print("-" * 10)

print(df[0])

print("-" * 10)

## 修改一个列标题：
df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True)
print(df[0])

print("-" * 10)

## 修改多个列标题：
df[0].rename(columns={'Unnamed: 1_level_1':'语文','Unnamed: 2_level_1':None},inplace=True)
print(df[0])

print("-" * 10)

## 不输出索引：
df[0] = df[0].to_string(index=False)
print(df[0])

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
[    Unnamed: 0_level_0          语文成绩          数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0             第一次             111.0             106.0
1             第二次             105.0             120.0
2             第三次             99.5             115.5]
<class 'list'>
----------
----------
   Unnamed: 0_level_0          语文成绩          数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0             第一次             111.0             106.0
1             第二次             105.0             120.0
2             第三次             99.5             115.5
----------
      姓名+历次成绩          语文成绩          数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0             第一次             111.0             106.0
1             第二次             105.0             120.0
2             第三次             99.5             115.5
----------
      姓名+历次成绩语文成绩数学成绩
  zhuohua的三次考试成绩    语文    NaN
0             第一次 111.0 106.0
1             第二次 105.0 120.0
2             第三次    99.5 115.5
----------
      姓名+历次成绩语文成绩数学成绩
zhuohua的三次考试成绩    语文    NaN
            第一次 111.0 106.0
            第二次 105.0 120.0
            第三次    99.5 115.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

def func1(): #自定义导出的函数

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
})

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

## 把结果导出到指定的html文件：
df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引（行标题）、列标题

print("-" * 10)
print("-" * 10)
print("-" * 10)

func2() #执行func2()

def func2(): #自定义导入的函数

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件

print(df)
print(type(df))

print("-" * 10)
print("-" * 10)

print(df[0])

print("-" * 10)

## 修改一个列标题：
df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True)

## 修改多个列标题：
df[0].rename(columns={'Unnamed: 1_level_1':0,'Unnamed: 2_level_1':0},inplace=True)
print(df[0])

print("-" * 10)

## 不输出索引：
df[0] = df[0].to_string(index=False)
print(df[0])

if __name__ == '__main__':

func1() #执行func1()

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
                     语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                   111.0    106.0
第二次                   105.0    120.0
第三次                   99.5    115.5
----------
----------
----------
[    Unnamed: 0_level_0          语文成绩          数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0             第一次             111.0             106.0
1             第二次             105.0             120.0
2             第三次             99.5             115.5]
<class 'list'>
----------
----------
   Unnamed: 0_level_0          语文成绩          数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0             第一次             111.0             106.0
1             第二次             105.0             120.0
2             第三次             99.5             115.5
----------
      姓名+历次成绩语文成绩数学成绩
  zhuohua的三次考试成绩       0       0
0             第一次 111.0 106.0
1             第二次 105.0 120.0
2             第三次    99.5 115.5
----------
      姓名+历次成绩语文成绩数学成绩
zhuohua的三次考试成绩       0       0
            第一次 111.0 106.0
            第二次 105.0 120.0
            第三次    99.5 115.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

def func1(): #自定义导出的函数

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年二班']
})

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引，再以“姓名”那一列的数据为索引

print(df)

## 把结果导出到指定的html文件：
df.to_html('d:/share/mybook_4.html',index=True,header=True) #保留索引（行标题）、列标题

def func2(): #自定义导入的函数

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('d:\\share\\mybook_4.html',encoding='utf-8') #导入指定的html文件

print(df)
print(type(df))

print("-" * 10)
print("-" * 10)

print(df[0])

print("-" * 10)

## 修改多个列标题：
df[0].rename(columns={'Unnamed: 0_level_0':0,'Unnamed: 1_level_0':None},inplace=True)

## 修改多个列标题：
df[0].rename(columns={'Unnamed: 2_level_1':None,'Unnamed: 3_level_1':'B'},inplace=True)
print(df[0])

print("-" * 10)

## 不输出索引：
df[0] = df[0].to_string(index=False)
print(df[0])

if __name__ == '__main__':

func1() #执行func1()

print("-" * 10)
print("-" * 10)
print("-" * 10)

func2() #执行func2()

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
               语文成绩  数学成绩
班级    姓名
三年一班李大杰    111.0    106.0
三年二班 Jacky    105.0    120.0
      zhuohua    99.5    115.5
----------
----------
----------
[  Unnamed: 0_level_0 Unnamed: 1_level_0          语文成绩          数学成绩
            班级             姓名 Unnamed: 2_level_1 Unnamed: 3_level_1
0          三年一班          李大杰             111.0             106.0
1          三年二班             Jacky             105.0             120.0
2          三年二班          zhuohua             99.5             115.5]
<class 'list'>
----------
----------
  Unnamed: 0_level_0 Unnamed: 1_level_0          语文成绩          数学成绩
            班级             姓名 Unnamed: 2_level_1 Unnamed: 3_level_1
0          三年一班          李大杰             111.0             106.0
1          三年二班             Jacky             105.0             120.0
2          三年二班          zhuohua             99.5             115.5
----------
      0    NaN 语文成绩数学成绩
   班级    姓名    NaN       B
0  三年一班李大杰 111.0 106.0
1  三年二班 Jacky 105.0 120.0
2  三年二班  zhuohua    99.5 115.5
----------
      0    NaN 语文成绩数学成绩
   班级    姓名    NaN       B
三年一班李大杰 111.0 106.0
三年二班 Jacky 105.0 120.0
三年二班  zhuohua    99.5 115.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,2,3]) #重新设置索引
print(df)

print("-" * 10)

## 所有列的缺失值都使用各个列的总和值进行填充：
df = df.fillna(df.sum())
print(df)

print("-" * 10)

df.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题
print(df)

print("-" * 3)

df.rename({0:'李大杰',1:'Jacky',2:'zhuohua'},axis=0,inplace=True) #修改多个行标题
print(df)

## 把结果导出到指定的html文件：
df.to_html('D:/mybook_5.html',index=True,header=True) #保留索引（行标题）、列标题

print("-" * 10)
print("-" * 10)
print("-" * 10)

Result_2 = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件
print(Result_2)

print("-" * 3)

print(Result_2[0])

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
----------
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
3    NaN    NaN
----------
语文成绩  数学成绩
0    111.0    106.0
1    105.0    120.0
2    99.5    115.5
3    315.5    341.5
----------
            语文成绩  数学成绩
0             111.0    106.0
1             105.0    120.0
2                99.5    115.5
各个列的总和    315.5    341.5
---
            语文成绩  数学成绩
李大杰          111.0    106.0
Jacky          105.0    120.0
zhuohua          99.5    115.5
各个列的总和    315.5    341.5
----------
----------
----------
[    Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5]
---
   Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件

print(df)

print("-" * 3)

print(df[0])

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的txt文件：
df[0].to_csv("D:/mybook_5.txt",sep='\t',index=False,header=True) #不保留索引（行标题），但保留列标题

## 导入指定的txt文件：
df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8')

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
[    Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5]
---
   Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5
----------
----------
   Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8') #导入指定的txt文件

print(df)

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的html文件：
df.to_html('D:/mybook_5.html',index=False,header=True) #不保留索引（行标题），但保留列标题

## 导入指定的html文件：
df = pd.read_html('D:/mybook_5.html',encoding='utf-8')

print(df)

print("-" * 3)

print(df[0])

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
   Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5
----------
----------
[    Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5]
---
   Unnamed: 0  语文成绩  数学成绩
0       李大杰    111.0    106.0
1       Jacky    105.0    120.0
2    zhuohua    99.5    115.5
3  各个列的总和    315.5    341.5

C:\Users\jacky\Desktop>

######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级']

Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['姓名']) #设置指定列的数据为索引
print(df)

print("-" * 10)

df['各位同学的总成绩'] = df.sum(axis=1) #按行求和
print(df)

print("-" * 10)

df = df.reindex(columns=['班级','各位同学的总成绩']) #重新设置列
print(df)

## 把结果导出到指定的html文件：
df.to_html('D:/Pandas的基础-6.html',index=True,header=True) #保留索引（行标题）、列标题

print("-" * 10)
print("-" * 10)
print("-" * 10)

Result_2 = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件
print(Result_2)

print("-" * 3)

print(Result_2[0])

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
   姓名  语文成绩  数学成绩  英语成绩    班级
0 李大杰    111.0    106    109  三年一班
1 Jacky    105.0    106    119  三年二班
2  zhuohua    99.5    115    130  三年二班
----------
----------
      语文成绩  数学成绩  英语成绩    班级
姓名
李大杰    111.0    106    109  三年一班
Jacky    105.0    106    119  三年二班
zhuohua    99.5    115    130  三年二班
----------
      语文成绩  数学成绩  英语成绩    班级  各位同学的总成绩
姓名
李大杰    111.0    106    109  三年一班          326.0
Jacky    105.0    106    119  三年二班          330.0
zhuohua    99.5    115    130  三年二班          344.5
----------
         班级  各位同学的总成绩
姓名
李大杰三年一班          326.0
Jacky 三年二班          330.0
zhuohua  三年二班          344.5
----------
----------
----------
[  Unnamed: 0_level_0             班级各位同学的总成绩
            姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0          李大杰          三年一班             326.0
1             Jacky          三年二班             330.0
2          zhuohua          三年二班             344.5]
---
  Unnamed: 0_level_0             班级各位同学的总成绩
            姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0          李大杰          三年一班             326.0
1             Jacky          三年二班             330.0
2          zhuohua          三年二班             344.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件

print(df)

print("-" * 3)

print(df[0])

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的csv文件：
df[0].to_csv("D:/Pandas的基础-6.csv",sep='\t',index=False,header=True) #不保留索引（行标题），但保留列标题

## 导入指定的csv文件：
df = pd.read_csv('D:/Pandas的基础-6.csv',sep='\t',encoding='utf-8')

print(df)

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
[  Unnamed: 0_level_0             班级各位同学的总成绩
            姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0          李大杰          三年一班             326.0
1             Jacky          三年二班             330.0
2          zhuohua          三年二班             344.5]
---
  Unnamed: 0_level_0             班级各位同学的总成绩
            姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0          李大杰          三年一班             326.0
1             Jacky          三年二班             330.0
2          zhuohua          三年二班             344.5
----------
----------
  Unnamed: 0_level_0             班级各位同学的总成绩
0             姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1          李大杰          三年一班             326.0
2             Jacky          三年二班             330.0
3          zhuohua          三年二班             344.5

C:\Users\jacky\Desktop>

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_csv("D:/Pandas的基础-6.csv",sep='\t',encoding='utf-8') #导入指定的csv文件

print(df)

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的html文件：
df.to_html('D:/Pandas的基础_5.html',index=False,header=True) #不保留索引（行标题），但保留列标题

## 导入指定的html文件：
df = pd.read_html('d:/Pandas的基础_5.html',encoding='utf-8')

print(df)

print("-" * 3)

print(df[0])

脚本运行的结果：
C:\Users\jacky\Desktop>python xx.py
  Unnamed: 0_level_0             班级各位同学的总成绩
0             姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1          李大杰          三年一班             326.0
2             Jacky          三年二班             330.0
3          zhuohua          三年二班             344.5
----------
----------
[  Unnamed: 0_level_0             班级各位同学的总成绩
0             姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1          李大杰          三年一班             326.0
2             Jacky          三年二班             330.0
3          zhuohua          三年二班             344.5]
---
  Unnamed: 0_level_0             班级各位同学的总成绩
0             姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1          李大杰          三年一班             326.0
2             Jacky          三年二班             330.0
3          zhuohua          三年二班             344.5

C:\Users\jacky\Desktop>

相关文章：
Pandas的基础
Pandas的日期时间数据转换

返回列表

Pandas的数据清洗

[收藏此主题] [关注此主题的新回复]

[通过 QQ、MSN 分享给朋友]