我有一个包含 3 张纸的 .xlsb 文件,每张纸有超过 100 万行。我正在尝试用 python 阅读这个。我尝试了 3 种不同的方法——分别使用 xlwings、pyxlsb 和 pyodbc 来读取文件。 3 种中最快的是 pyxlsb,但它仍然需要大量时间来读取文件。读取文件并处理它大约需要 47 分钟。我正在使用下面的代码。谁能建议一种加快速度的方法?我有 3 个这样的文件,每个 47 分钟太浪费了。
import pandas as pd
from pyxlsb import open_workbook as open_xlsb
df = {}
with open_xlsb('Inverter Data 2018.xlsb') as wb:
for i in range(len(wb.sheets)):
df[wb.sheets[i]] = []
with wb.get_sheet(wb.sheets[i]) as sheet:
for row in sheet.rows():
df[wb.sheets[i]].append([item.v for item in row])
df[wb.sheets[i]] = pd.DataFrame(df[wb.sheets[i]][1:], columns=df[wb.sheets[i]][0])
最佳答案
你能试试下面的代码吗:
import pandas as pd
df = pd.read_excel('Inverter Data 2018.xlsb', engine='pyxlsb', sheet_name='yourSheetName')
https://stackoverflow.com/questions/61038218/
相关文章:
javascript - 为什么 npm install 没有将包安装到/node_modules
unity3d - SceneManager LoadScene 在编辑器播放模式下不工作
visual-studio-code - vscode 获取对象属性到建议顶部
typescript - 我如何告诉 SentryWebpackPlugin 我的源映射的名称?
react-native - 当应用程序在后台运行时使用振动
vue.js - Vue 路由器延迟加载不起作用或创建单独的 block 文件
django - 有没有办法在 Django Rest Framework 和 Flutter 应用
reactjs - 为什么我在 react-native 中的 svg 没有显示任何阴影?