Pandas - 提取第 4 个字符后的所有文本

我正在尝试了解如何提取列中第 4 个字符之后的所有字符。

col_a
XYZ123
ABCD001

期待下面的内容

col_a, new_col
XYZ123, 23
ABCD001, D001

最佳答案

尝试使用字符串切片:

df['new_col']=df['col_a'].str[4:]

通过 re 模块:

import re
df['new_col']=df['col_a'].apply(lambda x:re.findall('[0-9]+', x)[0])

https://stackoverflow.com/questions/67613939/

相关文章:

android - Jetpack 撰写 : Textfield and FAB not using

c# - 在不使用 lambda 表达式的情况下从该方法传递额外参数时在方法内部订阅事件

kubernetes - Helm : How to avoid recreating secret

python - 如何从 yfinance 数据中删除时区?

c++ - 为什么 C++ 中 std::string 的复制方法在此程序中显示出奇怪的行为?

python - 无需替换即可生成置换数组

r - 使用 melt 将数据合并到一个长列中

typescript - 没有泛型的类型推断?

java - 如何断言数组中某个值的存在

pandas - 如何通过每行的第一个单词将 pandas 中的行汇总为该第一个单词的聚合?