python - 如何找到 pandas 数据框字符串列中的最大单词数?

我有一个包含一列字符串的数据框。我正在尝试查找 (a) 列中的最大字数和 (b) 包含具有最大字数的字符串的行。

我做了以下事情:

import pandas as pd

something = ["Hello how are you", "I am doing great", "Lets go camping"]

test = pd.DataFrame(something)
test.columns = ["Response"]

length_of_the_messages = test["Response"].str.split("\\s+")
print(length_of_the_messages)
print(length_of_the_messages.len().max())

但这会产生一个错误,提示 Series 确实没有属性 len。我怎样才能同时获得列中字符串中的最大单词数及其行索引?

最佳答案

您可以使用 .str 和索引 .idxmax:

import pandas as pd

something = ["Hello how are you", "I am doing great", "Lets go camping"]

test = pd.DataFrame(something)
test.columns = ["Response"]

length_of_the_messages = test["Response"].str.split("\\s+")

print(length_of_the_messages)
print("Max number of words = ", length_of_the_messages.str.len().max())
print("Index = ", length_of_the_messages.str.len().idxmax())

打印:

0    [Hello, how, are, you]
1     [I, am, doing, great]
2       [Lets, go, camping]
Name: Response, dtype: object

Max number of words =  4
Index =  0

https://stackoverflow.com/questions/67927014/

相关文章:

bash - 在组合前面的数据的同时在多行中添加值

javascript - 如何从标称字符串中删除 0,但不从 javascript 中的小数中删除

java - 如何在 Java 数组上设置新的属性或方法?

docker - docker compose up 后后端到 redis 连接被拒绝

javascript - 计算数组中每个元素的频率 - javascript

android - 臭名昭著的高度 :100% issue on chrome for androi

r - 从单个表中查找多列

html - 如何使整个 HTML 日期字段可点击?

c++ - 如何删除结构 vector 的重复项 C++

r - 将数据帧的每一行乘以它的向量 R