返回列表 发帖

Pandas的数据清洗

######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=['第一次','第二次','第三次']) #设置索引(行标题)

print(df)

print("-" * 10)
print("-" * 10)

df['数学成绩的升降情况'] = df['数学成绩'] - df['数学成绩'].shift() #数据移位

print(df)

脚本运行的结果:(NaN为缺失值)
C:\Users\jacky\Desktop>python xx.py
        语文成绩  数学成绩
第一次     111.0     106.0
第二次     105.0     120.0
第三次      99.5     115.5
----------
----------
        语文成绩  数学成绩  数学成绩的升降情况
第一次     111.0     106.0                 NaN
第二次     105.0     120.0                14.0
第三次      99.5     115.5                -4.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据:
Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']]
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    111.0     106.0                 NaN
第二次                    105.0     120.0                -6.0
第三次                     99.5     115.5                -5.5
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 输出“数学成绩”、“语文成绩”、“语文成绩的升降情况”的列数据:
Result_1 = df[['数学成绩','语文成绩','语文成绩的升降情况']]
print(Result_1)

print("-" * 10)

## 分别判断各个值是否为NaN:(为NaN时,结果显示为True)
Result_2 = df.isnull()
print(Result_2)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    111.0     106.0                 NaN
第二次                    105.0     120.0                -6.0
第三次                     99.5     115.5                -5.5
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
                       语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    False     False                True
第二次                    False     False               False
第三次                    False     False               False

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 重新设置各个列的位置:
Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    111.0     106.0                 NaN
第二次                    105.0     120.0                -6.0
第三次                     99.5     115.5                -5.5
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位
print(df)

print("-" * 10)

## 重新设置各个列的位置:
Result_1 = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(Result_1)

## 分别判断各个值是否为NaN:(为NaN时,结果显示为False)
Result_2 = df.notnull()
print(Result_2)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    111.0     106.0                 NaN
第二次                    105.0     120.0                -6.0
第三次                     99.5     115.5                -5.5
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
                       语文成绩  数学成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                     True      True               False
第二次                     True      True                True
第三次                     True      True                True

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“数学成绩”那一列中含有缺失值的行数据:')
Result_1 = df[df['数学成绩'].isnull()]
print(Result_1)

print("-" * 10)

print('输出“语文成绩”那一列中含有缺失值的行数据:')
Result_2 = df[df['语文成绩'].isnull()]
print(Result_2)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
输出“数学成绩”那一列中含有缺失值的行数据:
Empty DataFrame
Columns: [数学成绩, 语文成绩, 语文成绩的升降情况]
Index: []
----------
输出“语文成绩”那一列中含有缺失值的行数据:
Empty DataFrame
Columns: [数学成绩, 语文成绩, 语文成绩的升降情况]
Index: []

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中含有缺失值的行数据:')
Result_1 = df[df['语文成绩的升降情况'].isnull()]
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
输出“语文成绩的升降情况”那一列中含有缺失值的行数据:
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“数学成绩”那一列中不含有缺失值的行数据:')
Result_1 = df[df['数学成绩'].notnull()]
print(Result_1)

print("-" * 10)

print('输出“语文成绩”那一列中不含有缺失值的行数据:')
Result_2 = df[df['语文成绩'].notnull()]
print(Result_2)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
输出“数学成绩”那一列中不含有缺失值的行数据:
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
输出“语文成绩”那一列中不含有缺失值的行数据:
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:')
Result_1 = df[df['语文成绩的升降情况'].notnull()]
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

## 把“语文成绩的升降情况”那一列的缺失值填充为数值“0” :
df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna(0)
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 0.0
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

## 把“语文成绩的升降情况”那一列的缺失值填充为字符串“空值(Null)” :
df['语文成绩的升降情况'] = df['语文成绩的升降情况'].fillna('空值(Null)')
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
                       数学成绩  语文成绩 语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0       空值(Null)
第二次                    120.0     105.0                 -6
第三次                    115.5      99.5               -5.5

C:\Users\jacky\Desktop>










######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

print(df.drop_duplicates(['数学成绩'])) #去除指定列的重复数据,只保留第一行的行数据

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     106.0
第三次                     99.5     115.5
----------
----------
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第三次                     99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据,只保留第一行的行数据:
Result_1 = df.drop_duplicates(['数学成绩'],keep='first')
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     106.0
第三次                     99.5     115.5
----------
----------
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第三次                     99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据,只保留最后一行的行数据:
Result_1 = df.drop_duplicates(['数学成绩'],keep='last')
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     106.0
第三次                     99.5     115.5
----------
----------
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第二次                    105.0     106.0
第三次                     99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,119,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据,只保留最后一行的行数据:
Result_1 = df.drop_duplicates(['班级'],keep='last')
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       119  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
zhuohua      99.5       115       130  三年二班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115],
'英语成绩':[109,119,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据,不保留其行数据:
Result_1 = df.drop_duplicates(['数学成绩'],keep=False)
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0       106       119  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩      班级
zhuohua      99.5       115       130  三年二班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,106,115],
'英语成绩':[109,119,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据,不保留其行数据:
Result_1 = df.drop_duplicates(['班级'],keep=False)
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0       106       119  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
        语文成绩  数学成绩  英语成绩      班级
李大杰     111.0       106       109  三年一班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_index = ['李大杰','Jacky','zhuohua']

Key_columns = ['语文成绩','数学成绩','英语成绩','班级']

Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

## 去除指定列的重复数据,不保留其行数据:
Result_1 = df.drop_duplicates(['班级'],keep=False)
print(Result_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0       106       119  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
        语文成绩  数学成绩  英语成绩      班级
李大杰     111.0       106       109  三年一班

C:\Users\jacky\Desktop>










######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_columns = ['语文成绩','数学成绩','英语成绩','班级']

Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,2,0]) #重新设置索引

print(df)

脚本运行的结果:(这里重新设置了各个行的位置)
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩  英语成绩      班级
0     111.0       106       109  三年一班
1     105.0       106       119  三年二班
2      99.5       115       130  三年二班
----------
----------
   语文成绩  数学成绩  英语成绩      班级
1     105.0       106       119  三年二班
2      99.5       115       130  三年二班
0     111.0       106       109  三年一班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
})

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,2,0]) #重新设置索引

print(df)

脚本运行的结果:(这里重新设置了各个行的位置)
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
2      99.5     115.5
0     111.0     106.0

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2]) #重新设置索引

print(df)

脚本运行的结果:(NaN为缺失值)
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN       NaN
0     111.0     106.0
5       NaN       NaN
2      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,2,3,4,5]) #重新设置索引

print(df)

脚本运行的结果:(索引为数值“0”的那行数据没有出现了)
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
2      99.5     115.5
3       NaN       NaN
4       NaN       NaN
5       NaN       NaN

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,4,5,2],fill_value=0) #重新设置索引,并把所有列的缺失值都填充为数值“0”

print(df)

脚本运行的结果:(索引为数值“0”的那行数据没有出现了)
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
3       0.0       0.0
4       0.0       0.0
5       0.0       0.0
2      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,3,4,5,2]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna(0) #只把“数学成绩”那一列的缺失值填充为数值“0”

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
3       NaN       NaN
4       NaN       NaN
5       NaN       NaN
2      99.5     115.5
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
3       NaN       0.0
4       NaN       0.0
5       NaN       0.0
2      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,4,5,2],fill_value='(空值(Null)') #重新设置索引,并把所有列的缺失值填充为字符串“(空值(Null)”

print(df)

脚本运行的结果:(索引为数值“0”的那行数据没有出现了)
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
        语文成绩       数学成绩
1            105            120
3  (空值(Null)  (空值(Null)
4  (空值(Null)  (空值(Null)
5  (空值(Null)  (空值(Null)
2           99.5          115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,3,4,5,2]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna('空值') #只把“数学成绩”那一列的缺失值填充为字符串“空值”

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
3       NaN       NaN
4       NaN       NaN
5       NaN       NaN
2      99.5     115.5
----------
   语文成绩 数学成绩
0     111.0      106
1     105.0      120
3       NaN     空值
4       NaN     空值
5       NaN     空值
2      99.5    115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df = df.fillna(method='ffill') #所有列的缺失值都使用前一个非缺失值进行填充(和上面的一个数据一样)

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN       NaN
0     111.0     106.0
5       NaN       NaN
2      99.5     115.5
4       NaN       NaN
6       NaN       NaN
----------
   语文成绩  数学成绩
1     105.0     120.0
3     105.0     120.0
0     111.0     106.0
5     111.0     106.0
2      99.5     115.5
4      99.5     115.5
6      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna(method='ffill') #只把“数学成绩”那一列的缺失值使用前一个非缺失值进行填充

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN       NaN
0     111.0     106.0
5       NaN       NaN
2      99.5     115.5
4       NaN       NaN
6       NaN       NaN
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN     120.0
0     111.0     106.0
5       NaN     106.0
2      99.5     115.5
4       NaN     115.5
6       NaN     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df = df.fillna(method='bfill') #所有列的缺失值都使用后一个非缺失值进行填充(和下面的一个数据一样)

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN       NaN
0     111.0     106.0
5       NaN       NaN
2      99.5     115.5
4       NaN       NaN
6       NaN       NaN
----------
   语文成绩  数学成绩
1     105.0     120.0
3     111.0     106.0
0     111.0     106.0
5      99.5     115.5
2      99.5     115.5
4       NaN       NaN
6       NaN       NaN

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2,4,6]) #重新设置索引

print(df)

print("-" * 10)

df['数学成绩'] = df['数学成绩'].fillna(method='bfill') #只把“数学成绩”那一列的缺失值使用后一个非缺失值进行填充

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN       NaN
0     111.0     106.0
5       NaN       NaN
2      99.5     115.5
4       NaN       NaN
6       NaN       NaN
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN     106.0
0     111.0     106.0
5       NaN     115.5
2      99.5     115.5
4       NaN       NaN
6       NaN       NaN

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,2,3]) #重新设置索引
print(df)

print("-" * 10)

## 所有列的缺失值都使用各个列的总和值进行填充:
df_1 = df.fillna(df.sum())
print(df_1)

print("-" * 10)

df_1.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题
print(df_1)

print("-" * 10)
print("-" * 10)

## 所有列的缺失值都使用各个列的平均值进行填充:
df_2 = df.fillna(df.mean())
print(df_2)

print("-" * 10)

df_2.rename({3:'各个列的平均值'},axis=0,inplace=True) #修改一个行标题
print(df_2)

print("-" * 10)
print("-" * 10)

## 所有列的缺失值都使用各个列的中位数进行填充:
df_3 = df.fillna(df.median())
print(df_3)

print("-" * 10)

df_3.rename({3:'各个列的中位数'},axis=0,inplace=True) #修改一个行标题
print(df_3)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
3       NaN       NaN
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
3     315.5     341.5
----------
              语文成绩  数学成绩
0                111.0     106.0
1                105.0     120.0
2                 99.5     115.5
各个列的总和     315.5     341.5
----------
----------
     语文成绩    数学成绩
0  111.000000  106.000000
1  105.000000  120.000000
2   99.500000  115.500000
3  105.166667  113.833333
----------
                  语文成绩    数学成绩
0               111.000000  106.000000
1               105.000000  120.000000
2                99.500000  115.500000
各个列的平均值  105.166667  113.833333
----------
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
3     105.0     115.5
----------
                语文成绩  数学成绩
0                  111.0     106.0
1                  105.0     120.0
2                   99.5     115.5
各个列的中位数     105.0     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,2,3]) #重新设置索引
print(df)

print("-" * 10)

## 只把“数学成绩”那一列的缺失值使用该列的总和值进行填充:
df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].sum())
print(df)

print("-" * 10)

df.rename({3:'“数学成绩”那一列的总和'},axis=0,inplace=True) #修改一个行标题
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
3       NaN       NaN
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
3       NaN     341.5
----------
                        语文成绩  数学成绩
0                          111.0     106.0
1                          105.0     120.0
2                           99.5     115.5
“数学成绩”那一列的总和       NaN     341.5

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['zhuohua','Jacky','李大杰']) #重新设置索引

print(df)

脚本运行的结果:(这里重新设置了各个行的位置)
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩      班级
zhuohua      99.5       115       130  三年二班
Jacky       105.0        88       120  三年二班
李大杰      111.0       106       109  三年一班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df_1 = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value=8) #重新设置索引,并把所有列的缺失值都填充为数值“8”

print(df_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩      班级
mr001         8.0         8         8         8
李大杰      111.0       106       109  三年一班
mr003         8.0         8         8         8
zhuohua      99.5       115       130  三年二班
Jacky       105.0        88       120  三年二班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky']) #重新设置索引
print(df)

print("-" * 10)
df['数学成绩'] = df['数学成绩'].fillna(1) #只把“数学成绩”那一列的缺失值填充为数值“1”
print(df)

print("-" * 10)
df['英语成绩'] = df['英语成绩'].fillna(2) #再把“英语成绩”那一列的缺失值填充为数值“2”
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩      班级
mr001         NaN       NaN       NaN       NaN
李大杰      111.0     106.0     109.0  三年一班
mr003         NaN       NaN       NaN       NaN
zhuohua      99.5     115.0     130.0  三年二班
Jacky       105.0      88.0     120.0  三年二班
----------
         语文成绩  数学成绩  英语成绩      班级
mr001         NaN       1.0       NaN       NaN
李大杰      111.0     106.0     109.0  三年一班
mr003         NaN       1.0       NaN       NaN
zhuohua      99.5     115.0     130.0  三年二班
Jacky       105.0      88.0     120.0  三年二班
----------
         语文成绩  数学成绩  英语成绩      班级
mr001         NaN       1.0       2.0       NaN
李大杰      111.0     106.0     109.0  三年一班
mr003         NaN       1.0       2.0       NaN
zhuohua      99.5     115.0     130.0  三年二班
Jacky       105.0      88.0     120.0  三年二班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['mr001','李大杰','mr003','zhuohua','Jacky'],fill_value='空值') #重新设置索引,并把所有列的缺失值都填充为字符串“空值”

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
        语文成绩 数学成绩 英语成绩      班级
mr001       空值     空值     空值      空值
李大杰       111      106      109  三年一班
mr003       空值     空值     空值      空值
zhuohua     99.5      115      130  三年二班
Jacky        105       88      120  三年二班

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最大值']) #重新设置索引
print(df)

print("-" * 10)

## 把“数学成绩”那一列的缺失值使用该列的最大值进行填充:
df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].max())

## 把“班级”那一列的缺失值填充为字符串“最大值”:
df['班级'] = df['班级'].fillna('最大值')

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
                语文成绩  数学成绩  英语成绩      班级
李大杰             111.0     106.0     109.0  三年一班
zhuohua             99.5     115.0     130.0  三年二班
Jacky              105.0      88.0     120.0  三年二班
各个列的最大值       NaN       NaN       NaN       NaN
----------
                语文成绩  数学成绩  英语成绩      班级
李大杰             111.0     106.0     109.0  三年一班
zhuohua             99.5     115.0     130.0  三年二班
Jacky              105.0      88.0     120.0  三年二班
各个列的最大值       NaN     115.0       NaN    最大值

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(index=['李大杰','zhuohua','Jacky','各个列的最小值']) #重新设置索引
print(df)

print("-" * 10)

## 把“数学成绩”那一列的缺失值使用该列的最小值进行填充:
df['数学成绩'] = df['数学成绩'].fillna(df['数学成绩'].min())

## 把“班级”那一列的缺失值填充为字符串“最小值”:
df['班级'] = df['班级'].fillna('最小值')

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
                语文成绩  数学成绩  英语成绩      班级
李大杰             111.0     106.0     109.0  三年一班
zhuohua             99.5     115.0     130.0  三年二班
Jacky              105.0      88.0     120.0  三年二班
各个列的最小值       NaN       NaN       NaN       NaN
----------
                语文成绩  数学成绩  英语成绩      班级
李大杰             111.0     106.0     109.0  三年一班
zhuohua             99.5     115.0     130.0  三年二班
Jacky              105.0      88.0     120.0  三年二班
各个列的最小值       NaN      88.0       NaN    最小值

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df_1 = df.reindex(columns=['班级','数学成绩','英语成绩','语文成绩']) #重新设置列
print(df_1)

print("-" * 10)

df_1.rename(columns={'英语成绩':'英语成绩(New)'},inplace=True) #修改一个列标题
print(df_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
             班级  数学成绩  英语成绩  语文成绩
李大杰   三年一班       106       109     111.0
Jacky    三年二班        88       120     105.0
zhuohua  三年二班       115       130      99.5
----------
             班级  数学成绩  英语成绩(New)  语文成绩
李大杰   三年一班       106              109     111.0
Jacky    三年二班        88              120     105.0
zhuohua  三年二班       115              130      99.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 重新设置列,并把所有列的缺失值都填充为数值“8”:
df_1 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8)
print(df_1)

print("-" * 10)

## 重新设置列,并把所有列的缺失值都填充为字符串“空值”:
df_2 = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值')
print(df_2)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         mr001      班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰       8  三年一班       106       109         8     111.0
Jacky        8  三年二班        88       120         8     105.0
zhuohua      8  三年二班       115       130         8      99.5
----------
        mr001      班级  数学成绩  英语成绩 物理成绩  语文成绩
李大杰   空值  三年一班       106       109     空值     111.0
Jacky    空值  三年二班        88       120     空值     105.0
zhuohua  空值  三年二班       115       130     空值      99.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(columns=['mr001','班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置列
print(df)

print("-" * 10)
df['物理成绩'] = df['物理成绩'].fillna(8) #只把“物理成绩”那一列的缺失值填充为数值“8”
print(df)

print("-" * 10)
df['mr001'] = df['mr001'].fillna('空值') #再把“mr001”那一列的缺失值填充为字符串“空值”
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         mr001      班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰     NaN  三年一班       106       109       NaN     111.0
Jacky      NaN  三年二班        88       120       NaN     105.0
zhuohua    NaN  三年二班       115       130       NaN      99.5
----------
         mr001      班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰     NaN  三年一班       106       109       8.0     111.0
Jacky      NaN  三年二班        88       120       8.0     105.0
zhuohua    NaN  三年二班       115       130       8.0      99.5
----------
        mr001      班级  数学成绩  英语成绩  物理成绩  语文成绩
李大杰   空值  三年一班       106       109       8.0     111.0
Jacky    空值  三年二班        88       120       8.0     105.0
zhuohua  空值  三年二班       115       130       8.0      99.5

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级']

Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['姓名']) #设置指定列的数据为索引
print(df)

print("-" * 10)

df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列
print(df)

print("-" * 10)

df['各位同学的总成绩'] = df.sum(axis=1) #按行求和
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
      姓名  语文成绩  数学成绩  英语成绩      班级
0   李大杰     111.0       106       109  三年一班
1    Jacky     105.0       106       119  三年二班
2  zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩      班级
姓名
李大杰      111.0       106       109  三年一班
Jacky       105.0       106       119  三年二班
zhuohua      99.5       115       130  三年二班
----------
         语文成绩  数学成绩  英语成绩
姓名
李大杰      111.0       106       109
Jacky       105.0       106       119
zhuohua      99.5       115       130
----------
         语文成绩  数学成绩  英语成绩  各位同学的总成绩
姓名
李大杰      111.0       106       109             326.0
Jacky       105.0       106       119             330.0
zhuohua      99.5       115       130             344.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_index = ['李大杰','Jacky','zhuohua']

Key_columns = ['语文成绩','数学成绩','英语成绩','班级']

Key_data = [[111,106,109,'三年一班'],[105,106,119,'三年二班'],[99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,index=Key_index,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex(columns=['语文成绩','数学成绩','英语成绩']) #重新设置列
print(df)

print("-" * 10)

df['各位同学的平均成绩'] = df.mean(axis=1) #按行求平均值
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0       106       119  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩
李大杰      111.0       106       109
Jacky       105.0       106       119
zhuohua      99.5       115       130
----------
         语文成绩  数学成绩  英语成绩  各位同学的平均成绩
李大杰      111.0       106       109          108.666667
Jacky       105.0       106       119          110.000000
zhuohua      99.5       115       130          114.833333

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df_1 = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩']) #重新设置索引、列

print(df_1)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
             班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001         NaN       NaN       NaN       NaN       NaN
李大杰   三年一班     106.0     109.0       NaN     111.0
mr003         NaN       NaN       NaN       NaN       NaN
zhuohua  三年二班     115.0     130.0       NaN      99.5
Jacky    三年二班      88.0     120.0       NaN     105.0

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 重新设置索引、列,并把所有列的缺失值都填充为数值“8”:
df_1 = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value=8)

print(df_1)

print("-" * 10)

## 重新设置引、列,并把所有列的缺失值都填充为字符串“空值”:
df_2 = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'],fill_value='空值')

print(df_2)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
             班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001           8         8         8         8       8.0
李大杰   三年一班       106       109         8     111.0
mr003           8         8         8         8       8.0
zhuohua  三年二班       115       130         8      99.5
Jacky    三年二班        88       120         8     105.0
----------
             班级 数学成绩 英语成绩 物理成绩 语文成绩
mr001        空值     空值     空值     空值     空值
李大杰   三年一班      106      109     空值      111
mr003        空值     空值     空值     空值     空值
zhuohua  三年二班      115      130     空值     99.5
Jacky    三年二班       88      120     空值      105

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

## 重新设置索引、列:
df = df.reindex(
index=['mr001','李大杰','mr003','zhuohua','Jacky'],
columns=['班级','数学成绩','英语成绩','物理成绩','语文成绩'])

print(df)

print("-" * 10)

## 只把“数学成绩”那一列的缺失值填充为数值“1”:
df['数学成绩'] = df['数学成绩'].fillna(1)
print(df)

print("-" * 10)

## 再把“班级”那一列的缺失值填充为字符串“空值”:
df['班级'] = df['班级'].fillna('空值')
print(df)

print("-" * 10)

## 再修改“mr003”的“英语成绩”为 100 :
df.loc['mr003','英语成绩'] = 100
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
             班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001         NaN       NaN       NaN       NaN       NaN
李大杰   三年一班     106.0     109.0       NaN     111.0
mr003         NaN       NaN       NaN       NaN       NaN
zhuohua  三年二班     115.0     130.0       NaN      99.5
Jacky    三年二班      88.0     120.0       NaN     105.0
----------
             班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001         NaN       1.0       NaN       NaN       NaN
李大杰   三年一班     106.0     109.0       NaN     111.0
mr003         NaN       1.0       NaN       NaN       NaN
zhuohua  三年二班     115.0     130.0       NaN      99.5
Jacky    三年二班      88.0     120.0       NaN     105.0
----------
             班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001        空值       1.0       NaN       NaN       NaN
李大杰   三年一班     106.0     109.0       NaN     111.0
mr003        空值       1.0       NaN       NaN       NaN
zhuohua  三年二班     115.0     130.0       NaN      99.5
Jacky    三年二班      88.0     120.0       NaN     105.0
----------
             班级  数学成绩  英语成绩  物理成绩  语文成绩
mr001        空值       1.0       NaN       NaN       NaN
李大杰   三年一班     106.0     109.0       NaN     111.0
mr003        空值       1.0     100.0       NaN       NaN
zhuohua  三年二班     115.0     130.0       NaN      99.5
Jacky    三年二班      88.0     120.0       NaN     105.0

C:\Users\jacky\Desktop>










######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([1,3,0,5,2]) #重新设置索引

print(df)

print("-" * 10)

## 再修改索引为数值“3”的“数学成绩”为 100 :
df.loc[3,'数学成绩'] = 100
print(df)

print("-" * 10)

## 删除含有缺失值的行数据:(针对所有的列)
df = df.dropna()
print(df)

print("-" * 10)

## 删除旧索引后,重新设置索引:(索引默认从0开始)
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN       NaN
0     111.0     106.0
5       NaN       NaN
2      99.5     115.5
----------
   语文成绩  数学成绩
1     105.0     120.0
3       NaN     100.0
0     111.0     106.0
5       NaN       NaN
2      99.5     115.5
----------
   语文成绩  数学成绩
1     105.0     120.0
0     111.0     106.0
2      99.5     115.5
----------
   语文成绩  数学成绩
0     105.0     120.0
1     111.0     106.0
2      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

## 删除含有缺失值的行数据:(针对所有的列)
df = df.dropna()
print(df)

print("-" * 10)

## 删除旧索引后,重新设置索引:(索引默认从0开始)
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
  zhuohua的三次考试成绩  语文成绩  数学成绩
0                第一次     111.0     106.0
1                第二次     105.0     120.0
2                第三次      99.5     115.5
----------
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0                第一次     106.0     111.0                 NaN
1                第二次     120.0     105.0                -6.0
2                第三次     115.5      99.5                -5.5
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
1                第二次     120.0     105.0                -6.0
2                第三次     115.5      99.5                -5.5
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0                第二次     120.0     105.0                -6.0
1                第三次     115.5      99.5                -5.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['zhuohua的三次考试成绩','数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:')
df = df[df['语文成绩的升降情况'].notnull()]
print(df)

print("-" * 10)

## 删除旧索引后,重新设置索引:(索引默认从0开始)
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
  zhuohua的三次考试成绩  语文成绩  数学成绩
0                第一次     111.0     106.0
1                第二次     105.0     120.0
2                第三次      99.5     115.5
----------
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0                第一次     106.0     111.0                 NaN
1                第二次     120.0     105.0                -6.0
2                第三次     115.5      99.5                -5.5
----------
输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
1                第二次     120.0     105.0                -6.0
2                第三次     115.5      99.5                -5.5
----------
  zhuohua的三次考试成绩  数学成绩  语文成绩  语文成绩的升降情况
0                第二次     120.0     105.0                -6.0
1                第三次     115.5      99.5                -5.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[1,2,3])

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

print("-" * 10)
print("-" * 10)

df['语文成绩的升降情况'] = df['语文成绩'] - df['语文成绩'].shift() #数据移位

## 重新设置各个列的位置:
df = df.reindex(columns=['数学成绩','语文成绩','语文成绩的升降情况'])
print(df)

print("-" * 10)

print('输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:')
df = df[df['语文成绩的升降情况'].notnull()]
print(df)

print("-" * 10)

## 删除旧索引后,重新设置索引:(索引默认从0开始)
df = df.dropna().reset_index(drop=True)
print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第一次                    106.0     111.0                 NaN
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
输出“语文成绩的升降情况”那一列中不含有缺失值的行数据:
                       数学成绩  语文成绩  语文成绩的升降情况
zhuohua的三次考试成绩
第二次                    120.0     105.0                -6.0
第三次                    115.5      99.5                -5.5
----------
   数学成绩  语文成绩  语文成绩的升降情况
0     120.0     105.0                -6.0
1     115.5      99.5                -5.5

C:\Users\jacky\Desktop>










######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,88,115],
'英语成绩':[109,120,130],
'班级':['三年一班','三年二班','三年二班']
},
index=['李大杰','Jacky','zhuohua'])

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
         语文成绩  数学成绩  英语成绩      班级
李大杰      111.0       106       109  三年一班
Jacky       105.0        88       120  三年二班
zhuohua      99.5       115       130  三年二班
----------
----------
李大杰   语文成绩         111
         数学成绩         106
         英语成绩         109
         班级        三年一班
Jacky    语文成绩         105
         数学成绩          88
         英语成绩         120
         班级        三年二班
zhuohua  语文成绩        99.5
         数学成绩         115
         英语成绩         130
         班级        三年二班
dtype: object

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
})

print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
      姓名  语文成绩  数学成绩      班级
0   李大杰     111.0     106.0  三年一班
1    Jacky     105.0     120.0  三年二班
2  zhuohua      99.5     115.5  三年一班
----------
----------
                  语文成绩  数学成绩
班级     姓名
三年一班 李大杰      111.0     106.0
三年二班 Jacky       105.0     120.0
三年一班 zhuohua      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年二班']
})

print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
      姓名  语文成绩  数学成绩      班级
0   李大杰     111.0     106.0  三年一班
1    Jacky     105.0     120.0  三年二班
2  zhuohua      99.5     115.5  三年二班
----------
----------
                  语文成绩  数学成绩
班级     姓名
三年一班 李大杰      111.0     106.0
三年二班 Jacky       105.0     120.0
         zhuohua      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
})

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                  语文成绩  数学成绩
班级     姓名
三年一班 李大杰      111.0     106.0
三年二班 Jacky       105.0     120.0
三年一班 zhuohua      99.5     115.5
----------
----------
班级      姓名
三年一班  李大杰   语文成绩    111.0
                   数学成绩    106.0
三年二班  Jacky    语文成绩    105.0
                   数学成绩    120.0
三年一班  zhuohua  语文成绩     99.5
                   数学成绩    115.5
dtype: float64

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年二班']
})

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                  语文成绩  数学成绩
班级     姓名
三年一班 李大杰      111.0     106.0
三年二班 Jacky       105.0     120.0
         zhuohua      99.5     115.5
----------
----------
班级      姓名
三年一班  李大杰   语文成绩    111.0
                   数学成绩    106.0
三年二班  Jacky    语文成绩    105.0
                   数学成绩    120.0
          zhuohua  语文成绩     99.5
                   数学成绩    115.5
dtype: float64

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年二班']
})

df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引

print(df)

print("-" * 10)
print("-" * 10)

df = df.stack() #把所有列转换为行

print(df)

print("-" * 10)
print("-" * 10)

df = df.unstack() #把所有行转换为列

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                  语文成绩  数学成绩
班级     姓名
三年一班 李大杰      111.0     106.0
三年二班 Jacky       105.0     120.0
         zhuohua      99.5     115.5
----------
----------
班级      姓名
三年一班  李大杰   语文成绩    111.0
                   数学成绩    106.0
三年二班  Jacky    语文成绩    105.0
                   数学成绩    120.0
          zhuohua  语文成绩     99.5
                   数学成绩    115.5
dtype: float64
----------
----------
                  语文成绩  数学成绩
班级     姓名
三年一班 李大杰      111.0     106.0
三年二班 Jacky       105.0     120.0
         zhuohua      99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
})

print(df)

print("-" * 10)
print("-" * 10)

print("输出各个班级的学生的语文成绩:")

## 以“姓名”那一列的数据为行,以“班级”那一列的数据为列,以“语文成绩”那一列的数据为填充值:
df = df.pivot(index='姓名',columns='班级',values='语文成绩')

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
      姓名  语文成绩  数学成绩      班级
0   李大杰     111.0     106.0  三年一班
1    Jacky     105.0     120.0  三年二班
2  zhuohua      99.5     115.5  三年一班
----------
----------
输出各个班级的学生的语文成绩:
班级     三年一班  三年二班
姓名
Jacky         NaN     105.0
zhuohua      99.5       NaN
李大杰      111.0       NaN

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df = pd.DataFrame(
{
'姓名':['李大杰','Jacky','zhuohua'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
'班级':['三年一班','三年二班','三年一班']
},
index=[1,2,3])

print(df)

print("-" * 10)
print("-" * 10)

print("输出各个班级的学生的数学成绩:")

## 以“姓名”那一列的数据为行,以“班级”那一列的数据为列,以“数学成绩”那一列的数据为填充值:
df = df.pivot(index='姓名',columns='班级',values='数学成绩')

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
      姓名  语文成绩  数学成绩      班级
1   李大杰     111.0     106.0  三年一班
2    Jacky     105.0     120.0  三年二班
3  zhuohua      99.5     115.5  三年一班
----------
----------
输出各个班级的学生的数学成绩:
班级     三年一班  三年二班
姓名
Jacky         NaN     120.0
zhuohua     115.5       NaN
李大杰      106.0       NaN

C:\Users\jacky\Desktop>










Pandas的导出和导入(html文件):

Win7连接公网安装第三方库(lxml):
C:\Users\jacky\Desktop>pip3 install lxml==4.9.3 -i http://mirrors.aliyun.com/pypi/simple --trusted-host=mirrors.aliyun.com


第三方库(lxml)安装成功:
C:\Users\jacky\Desktop>pip3 freeze
lxml==4.9.3
numpy==1.19.5
pandas==1.1.5
python-dateutil==2.8.2
pytz==2023.3
six==1.16.0

C:\Users\jacky\Desktop>





######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
})

df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
print(df)

## 把结果分别导出到指定的html文件:
df.to_html('C:\\Users\\jacky\\Desktop\\mybook_1.html',index=False,header=True) #不保留索引(行标题),但保留列标题

df.to_html('C:/Users/jacky/Desktop/mybook_2.html',index=False,header=False) #不保留索引(行标题)、列标题

df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引(行标题)、列标题

脚本运行的结果:(假如目标文件存在则覆盖,不存在则自动创建)
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件

print(df)
print(type(df))

print("-" * 10)
print("-" * 10)

print(df[0])

print("-" * 10)

## 修改一个列标题:
df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True)
print(df[0])

print("-" * 10)

## 修改多个列标题:
df[0].rename(columns={'Unnamed: 1_level_1':'语文','Unnamed: 2_level_1':None},inplace=True)
print(df[0])

print("-" * 10)

## 不输出索引:
df[0] = df[0].to_string(index=False)
print(df[0])

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
[     Unnamed: 0_level_0           语文成绩           数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0                第一次              111.0              106.0
1                第二次              105.0              120.0
2                第三次               99.5              115.5]
<class 'list'>
----------
----------
     Unnamed: 0_level_0           语文成绩           数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0                第一次              111.0              106.0
1                第二次              105.0              120.0
2                第三次               99.5              115.5
----------
          姓名+历次成绩           语文成绩           数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0                第一次              111.0              106.0
1                第二次              105.0              120.0
2                第三次               99.5              115.5
----------
          姓名+历次成绩 语文成绩 数学成绩
  zhuohua的三次考试成绩     语文      NaN
0                第一次    111.0    106.0
1                第二次    105.0    120.0
2                第三次     99.5    115.5
----------
        姓名+历次成绩 语文成绩 数学成绩
zhuohua的三次考试成绩     语文      NaN
               第一次    111.0    106.0
               第二次    105.0    120.0
               第三次     99.5    115.5

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

def func1(): #自定义导出的函数

        pd.set_option('display.unicode.east_asian_width',True)

        #使用字典创建DataFrame数据
        df = pd.DataFrame(
        {
        'zhuohua的三次考试成绩':['第一次','第二次','第三次'],
        '语文成绩':[111,105,99.5],
        '数学成绩':[106,120,115.5],
        })

        df = df.set_index(['zhuohua的三次考试成绩']) #设置指定列的数据为索引
        print(df)
       
        ## 把结果导出到指定的html文件:
        df.to_html('d:/share/mybook_3.html',index=True,header=True) #保留索引(行标题)、列标题

        print("-" * 10)
        print("-" * 10)
        print("-" * 10)
       
        func2() #执行func2()
       
def func2(): #自定义导入的函数

        pd.set_option('display.unicode.east_asian_width',True)

        df = pd.read_html('d:/share/mybook_3.html',encoding='utf-8') #导入指定的html文件

        print(df)
        print(type(df))
       
        print("-" * 10)
        print("-" * 10)

        print(df[0])

        print("-" * 10)

        ## 修改一个列标题:
        df[0].rename(columns={'Unnamed: 0_level_0':'姓名+历次成绩'},inplace=True)

        ## 修改多个列标题:
        df[0].rename(columns={'Unnamed: 1_level_1':0,'Unnamed: 2_level_1':0},inplace=True)
        print(df[0])

        print("-" * 10)

        ## 不输出索引:
        df[0] = df[0].to_string(index=False)
        print(df[0])

if __name__ == '__main__':

        func1() #执行func1()

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                       语文成绩  数学成绩
zhuohua的三次考试成绩
第一次                    111.0     106.0
第二次                    105.0     120.0
第三次                     99.5     115.5
----------
----------
----------
[     Unnamed: 0_level_0           语文成绩           数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0                第一次              111.0              106.0
1                第二次              105.0              120.0
2                第三次               99.5              115.5]
<class 'list'>
----------
----------
     Unnamed: 0_level_0           语文成绩           数学成绩
  zhuohua的三次考试成绩 Unnamed: 1_level_1 Unnamed: 2_level_1
0                第一次              111.0              106.0
1                第二次              105.0              120.0
2                第三次               99.5              115.5
----------
          姓名+历次成绩 语文成绩 数学成绩
  zhuohua的三次考试成绩        0        0
0                第一次    111.0    106.0
1                第二次    105.0    120.0
2                第三次     99.5    115.5
----------
        姓名+历次成绩 语文成绩 数学成绩
zhuohua的三次考试成绩        0        0
               第一次    111.0    106.0
               第二次    105.0    120.0
               第三次     99.5    115.5

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

def func1(): #自定义导出的函数

        pd.set_option('display.unicode.east_asian_width',True)

        #使用字典创建DataFrame数据
        df = pd.DataFrame(
        {
        '姓名':['李大杰','Jacky','zhuohua'],
        '语文成绩':[111,105,99.5],
        '数学成绩':[106,120,115.5],
        '班级':['三年一班','三年二班','三年二班']
        })

        df = df.set_index(['班级','姓名']) #先以“班级”那一列的数据为索引,再以“姓名”那一列的数据为索引

        print(df)
       
        ## 把结果导出到指定的html文件:
        df.to_html('d:/share/mybook_4.html',index=True,header=True) #保留索引(行标题)、列标题

def func2(): #自定义导入的函数

        pd.set_option('display.unicode.east_asian_width',True)

        df = pd.read_html('d:\\share\\mybook_4.html',encoding='utf-8') #导入指定的html文件

        print(df)
        print(type(df))
       
        print("-" * 10)
        print("-" * 10)

        print(df[0])

        print("-" * 10)

        ## 修改多个列标题:
        df[0].rename(columns={'Unnamed: 0_level_0':0,'Unnamed: 1_level_0':None},inplace=True)

        ## 修改多个列标题:
        df[0].rename(columns={'Unnamed: 2_level_1':None,'Unnamed: 3_level_1':'B'},inplace=True)
        print(df[0])

        print("-" * 10)

        ## 不输出索引:
        df[0] = df[0].to_string(index=False)
        print(df[0])

if __name__ == '__main__':

        func1() #执行func1()
       
        print("-" * 10)
        print("-" * 10)
        print("-" * 10)
       
        func2() #执行func2()

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
                  语文成绩  数学成绩
班级     姓名
三年一班 李大杰      111.0     106.0
三年二班 Jacky       105.0     120.0
         zhuohua      99.5     115.5
----------
----------
----------
[  Unnamed: 0_level_0 Unnamed: 1_level_0           语文成绩           数学成绩
                班级               姓名 Unnamed: 2_level_1 Unnamed: 3_level_1
0           三年一班             李大杰              111.0              106.0
1           三年二班              Jacky              105.0              120.0
2           三年二班            zhuohua               99.5              115.5]
<class 'list'>
----------
----------
  Unnamed: 0_level_0 Unnamed: 1_level_0           语文成绩           数学成绩
                班级               姓名 Unnamed: 2_level_1 Unnamed: 3_level_1
0           三年一班             李大杰              111.0              106.0
1           三年二班              Jacky              105.0              120.0
2           三年二班            zhuohua               99.5              115.5
----------
          0      NaN 语文成绩 数学成绩
       班级     姓名      NaN        B
0  三年一班   李大杰    111.0    106.0
1  三年二班    Jacky    105.0    120.0
2  三年二班  zhuohua     99.5    115.5
----------
        0      NaN 语文成绩 数学成绩
     班级     姓名      NaN        B
三年一班   李大杰    111.0    106.0
三年二班    Jacky    105.0    120.0
三年二班  zhuohua     99.5    115.5

C:\Users\jacky\Desktop>










######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

#使用字典创建DataFrame数据
df=pd.DataFrame(
{
'语文成绩':[111,105,99.5],
'数学成绩':[106,120,115.5],
},
index=[0,1,2])

print(df)

print("-" * 10)
print("-" * 10)

df = df.reindex([0,1,2,3]) #重新设置索引
print(df)

print("-" * 10)

## 所有列的缺失值都使用各个列的总和值进行填充:
df = df.fillna(df.sum())
print(df)

print("-" * 10)

df.rename({3:'各个列的总和'},axis=0,inplace=True) #修改一个行标题
print(df)

print("-" * 3)

df.rename({0:'李大杰',1:'Jacky',2:'zhuohua'},axis=0,inplace=True) #修改多个行标题
print(df)

## 把结果导出到指定的html文件:
df.to_html('D:/mybook_5.html',index=True,header=True) #保留索引(行标题)、列标题

print("-" * 10)
print("-" * 10)
print("-" * 10)

Result_2 = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件
print(Result_2)

print("-" * 3)

print(Result_2[0])

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
----------
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
3       NaN       NaN
----------
   语文成绩  数学成绩
0     111.0     106.0
1     105.0     120.0
2      99.5     115.5
3     315.5     341.5
----------
              语文成绩  数学成绩
0                111.0     106.0
1                105.0     120.0
2                 99.5     115.5
各个列的总和     315.5     341.5
---
              语文成绩  数学成绩
李大杰           111.0     106.0
Jacky            105.0     120.0
zhuohua           99.5     115.5
各个列的总和     315.5     341.5
----------
----------
----------
[     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5]
---
     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('D:/mybook_5.html',encoding='utf-8') #导入指定的html文件

print(df)

print("-" * 3)

print(df[0])

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的txt文件:
df[0].to_csv("D:/mybook_5.txt",sep='\t',index=False,header=True) #不保留索引(行标题),但保留列标题

## 导入指定的txt文件:
df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8')

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
[     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5]
---
     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5
----------
----------
     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_csv("D:/mybook_5.txt",sep='\t',encoding='utf-8') #导入指定的txt文件

print(df)

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的html文件:
df.to_html('D:/mybook_5.html',index=False,header=True) #不保留索引(行标题),但保留列标题

## 导入指定的html文件:
df = pd.read_html('D:/mybook_5.html',encoding='utf-8')

print(df)

print("-" * 3)

print(df[0])

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5
----------
----------
[     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5]
---
     Unnamed: 0  语文成绩  数学成绩
0        李大杰     111.0     106.0
1         Jacky     105.0     120.0
2       zhuohua      99.5     115.5
3  各个列的总和     315.5     341.5

C:\Users\jacky\Desktop>





######
######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

Key_columns = ['姓名','语文成绩','数学成绩','英语成绩','班级']

Key_data = [['李大杰',111,106,109,'三年一班'],['Jacky',105,106,119,'三年二班'],['zhuohua',99.5,115,130,'三年二班']]

df = pd.DataFrame(data=Key_data,columns=Key_columns) #使用二维数组创建DataFrame数据
print(df)

print("-" * 10)
print("-" * 10)

df = df.set_index(['姓名']) #设置指定列的数据为索引
print(df)

print("-" * 10)

df['各位同学的总成绩'] = df.sum(axis=1) #按行求和
print(df)

print("-" * 10)

df = df.reindex(columns=['班级','各位同学的总成绩']) #重新设置列
print(df)

## 把结果导出到指定的html文件:
df.to_html('D:/Pandas的基础-6.html',index=True,header=True) #保留索引(行标题)、列标题

print("-" * 10)
print("-" * 10)
print("-" * 10)

Result_2 = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件
print(Result_2)

print("-" * 3)

print(Result_2[0])

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
      姓名  语文成绩  数学成绩  英语成绩      班级
0   李大杰     111.0       106       109  三年一班
1    Jacky     105.0       106       119  三年二班
2  zhuohua      99.5       115       130  三年二班
----------
----------
         语文成绩  数学成绩  英语成绩      班级
姓名
李大杰      111.0       106       109  三年一班
Jacky       105.0       106       119  三年二班
zhuohua      99.5       115       130  三年二班
----------
         语文成绩  数学成绩  英语成绩      班级  各位同学的总成绩
姓名
李大杰      111.0       106       109  三年一班             326.0
Jacky       105.0       106       119  三年二班             330.0
zhuohua      99.5       115       130  三年二班             344.5
----------
             班级  各位同学的总成绩
姓名
李大杰   三年一班             326.0
Jacky    三年二班             330.0
zhuohua  三年二班             344.5
----------
----------
----------
[  Unnamed: 0_level_0               班级   各位同学的总成绩
                姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0             李大杰           三年一班              326.0
1              Jacky           三年二班              330.0
2            zhuohua           三年二班              344.5]
---
  Unnamed: 0_level_0               班级   各位同学的总成绩
                姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0             李大杰           三年一班              326.0
1              Jacky           三年二班              330.0
2            zhuohua           三年二班              344.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_html('d:/Pandas的基础-6.html',encoding='utf-8') #导入指定的html文件

print(df)

print("-" * 3)

print(df[0])

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的csv文件:
df[0].to_csv("D:/Pandas的基础-6.csv",sep='\t',index=False,header=True) #不保留索引(行标题),但保留列标题

## 导入指定的csv文件:
df = pd.read_csv('D:/Pandas的基础-6.csv',sep='\t',encoding='utf-8')

print(df)

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
[  Unnamed: 0_level_0               班级   各位同学的总成绩
                姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0             李大杰           三年一班              326.0
1              Jacky           三年二班              330.0
2            zhuohua           三年二班              344.5]
---
  Unnamed: 0_level_0               班级   各位同学的总成绩
                姓名 Unnamed: 1_level_1 Unnamed: 2_level_1
0             李大杰           三年一班              326.0
1              Jacky           三年二班              330.0
2            zhuohua           三年二班              344.5
----------
----------
  Unnamed: 0_level_0                班级    各位同学的总成绩
0               姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1             李大杰            三年一班               326.0
2              Jacky            三年二班               330.0
3            zhuohua            三年二班               344.5

C:\Users\jacky\Desktop>



######

#coding=utf-8

import pandas as pd

pd.set_option('display.unicode.east_asian_width',True)

df = pd.read_csv("D:/Pandas的基础-6.csv",sep='\t',encoding='utf-8') #导入指定的csv文件

print(df)

print("-" * 10)
print("-" * 10)

## 把结果导出到指定的html文件:
df.to_html('D:/Pandas的基础_5.html',index=False,header=True) #不保留索引(行标题),但保留列标题

## 导入指定的html文件:
df = pd.read_html('d:/Pandas的基础_5.html',encoding='utf-8')

print(df)

print("-" * 3)

print(df[0])

脚本运行的结果:
C:\Users\jacky\Desktop>python xx.py
  Unnamed: 0_level_0                班级    各位同学的总成绩
0               姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1             李大杰            三年一班               326.0
2              Jacky            三年二班               330.0
3            zhuohua            三年二班               344.5
----------
----------
[  Unnamed: 0_level_0                班级    各位同学的总成绩
0               姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1             李大杰            三年一班               326.0
2              Jacky            三年二班               330.0
3            zhuohua            三年二班               344.5]
---
  Unnamed: 0_level_0                班级    各位同学的总成绩
0               姓名  Unnamed: 1_level_1  Unnamed: 2_level_1
1             李大杰            三年一班               326.0
2              Jacky            三年二班               330.0
3            zhuohua            三年二班               344.5

C:\Users\jacky\Desktop>





相关文章:
Pandas的基础
Pandas的日期时间数据转换

返回列表