有一个excel文件testFile.xlsx,如下所示:
ID ENTITY STATE
1 Montgomery County Muni Utility Dist No.39 TX
2 State of Washington WA
3 Waterloo CUSD 5 IL
4 Staunton CUSD 6 IL
5 Berea City SD OH
6 City of Coshocton OH
现在我要将数据导入到AWS GLUE数据库中,AWS GLUE中已经创建了一个爬虫,运行爬虫后AWS GLUE数据库中的表中没有任何内容。我想这应该是 AWS GLUE 中分类器的问题,但不知道如何创建合适的分类器来成功将 excel 文件中的数据导入 AWS GLUE 数据库。感谢您的任何回答或建议。
最佳答案
恐怕 Glue Crawlers 没有针对 MS Excel 文件(.xlsx 或 .xls)的分类器。 Here您可以找到支持的格式和内置分类器的列表。在导出到 AWS Glue Catalog 之前,最好将文件转换为 CSV 或其他一些支持的格式。
https://stackoverflow.com/questions/47541153/