python - 将 Python 正则表达式用于 Twitter 数据

我在我的应用程序中过滤推文,并希望返回文本中包含特定单词的所有推文。因此,如果我正在过滤 BBC 并且我想要 BBC 的所有实例,例如。 BBC、bbc、BBC1、#BBC、@bbc,我怎么能写正则表达式。

到目前为止我在做:

re.compile(r'#|@[0-9]'+term, re.IGNORECASE)

Term 是一个包含单词的列表,我只想返回列表中带有额外的 @ 或 # 或 0-9 前缀或附加该单词​​或单词本身的那些单词。

谢谢

最佳答案

使用 '\b' 分隔符查找整个单词:

re.compile(r'\b(?:#|@|)[0-9]*%s[0-9]*\b' % re.escape(term), re.IGNORECASE)

https://stackoverflow.com/questions/13425584/

相关文章:

xcode - 如何在 XCode/clang 中为 iPhone 编译独立的 ARM 程序集文件

php - 如何在 wordpress 中添加自定义 HTML 表单?

php - Wordpress 主题选项不会保存

python-2.7 - python : i defined a function in a cl

php - Wordpress wp_editor 不更新文本区域 $_POST 数据

jasper-reports - 字符串表达式的模式(格式)

Wordpress - 在配置文件页面上删除 "Roles"

sql - 当一个值为 null 时未拾取不匹配

php - 在 foreach 循环中使用数组变量

.net - 如果我有一个返回不同列表的方法,我应该让它返回 ISet 而不是 IEnumer