python-3.x - 在 python 中更快地读取大型 xlsb 文件

我有一个包含 3 张纸的 .xlsb 文件,每张纸有超过 100 万行。我正在尝试用 python 阅读这个。我尝试了 3 种不同的方法——分别使用 xlwings、pyxlsb 和 pyodbc 来读取文件。 3 种中最快的是 pyxlsb,但它仍然需要大量时间来读取文件。读取文件并处理它大约需要 47 分钟。我正在使用下面的代码。谁能建议一种加快速度的方法?我有 3 个这样的文件,每个 47 分钟太浪费了。

import pandas as pd
from pyxlsb import open_workbook as open_xlsb
df = {}
with open_xlsb('Inverter Data 2018.xlsb') as wb:
    for i in range(len(wb.sheets)):
        df[wb.sheets[i]] = []
        with wb.get_sheet(wb.sheets[i]) as sheet:
            for row in sheet.rows():
                df[wb.sheets[i]].append([item.v for item in row])
        df[wb.sheets[i]] = pd.DataFrame(df[wb.sheets[i]][1:], columns=df[wb.sheets[i]][0])

最佳答案

你能试试下面的代码吗:

import pandas as pd
df = pd.read_excel('Inverter Data 2018.xlsb', engine='pyxlsb', sheet_name='yourSheetName')

https://stackoverflow.com/questions/61038218/

相关文章:

javascript - 为什么 npm install 没有将包安装到/node_modules

unity3d - SceneManager LoadScene 在编辑器播放模式下不工作

visual-studio-code - vscode 获取对象属性到建议顶部

typescript - 我如何告诉 SentryWebpackPlugin 我的源映射的名称?

react-native - 当应用程序在后台运行时使用振动

vue.js - Vue 路由器延迟加载不起作用或创建单独的 block 文件

django - 有没有办法在 Django Rest Framework 和 Flutter 应用

reactjs - 为什么我在 react-native 中的 svg 没有显示任何阴影?

php - 如何使用带有 "grpc_php_plugin"的 PHP 和 Windows 10 的

Angular 8 - POST + 重定向与提交 HTML

完全一样,但不使用 DO