如何获取 Pandas DataFrame 的第一列作为 Series

在数据分析和处理中,Pandas 是一个非常强大且灵活的库。它允许用户轻松地进行数据操作和分析。本文将介绍如何从 Pandas DataFrame 中提取第一列并将其转换为 Pandas Series。

什么是 DataFrame 和 Series?

在 Pandas 中,DataFrame 是一个二维表格结构,类似于 Excel 表格或 SQL 数据表。它可以包含不同类型的列,并且允许我们对数据进行各种操作。Series 则是一维数组对象,可以看作是 DataFrame 的单个列或行。

获取 DataFrame 的第一列

假设我们有一个 DataFrame 包含一些销售数据:

import pandas as pd

data = {
    '产品': ['苹果', '香蕉', '橙子', '葡萄'],
    '数量': [10, 20, 15, 8],
    '价格': [3.5, 2.0, 4.5, 6.0]
}

df = pd.DataFrame(data)
print(df)

输出结果为:

   产品  数量  价格
0  苹果  10   3.5
1  香蕉  20   2.0
2  橙子  15   4.5
3  葡萄   8   6.0

使用列名获取第一列

如果我们知道 DataFrame 中第一列的名称,可以直接使用该名称来提取 Series:

first_column_series = df['产品']
print(first_column_series)

输出结果为:

0    苹果
1    香蕉
2    橙子
3    葡萄
Name: 产品, dtype: object

使用列索引获取第一列

如果我们不知道第一列的名称,或者希望使用索引来提取列,可以这样做:

first_column_series = df.iloc[:, 0]
print(first_column_series)

iloc 是基于整数位置进行选择的方法。: 表示所有行,0 表示第一列。

输出结果为:

0    苹果
1    香蕉
2    橙子
3    葡萄
Name: 产品, dtype: object

使用 DataFrame.pop() 方法

如果我们希望从 DataFrame 中移除并获取第一列,可以使用 pop() 方法:

first_column_series = df.pop('产品')
print(first_column_series)

输出结果为:

0    苹果
1    香蕉
2    橙子
3    葡萄
Name: 产品, dtype: object

此时,原 DataFrame 的第一列已经被移除:

print(df)

输出结果为:

   数量  价格
0    10   3.5
1    20   2.0
2    15   4.5
3     8   6.0

总结

从 Pandas DataFrame 中提取第一列并将其转换为 Series 是一个非常常见的操作。通过使用列名、列索引或 pop() 方法,我们可以方便地完成这一任务。这些方法各有特点,可以根据具体需求选择合适的方式。