SQL数据转换CSV丢失数据 #1

Guo-Zhang · 2024-02-19T06:32:13Z

先把mySQL的数据下载下来，保存在csv，然后再用csv的数据去用Pandas匹配，这样得到的数据跟最初的数据不太一样，不知道什么原因。现在去掉保存csv这个步骤，数据就能匹配得上了
。

建议1：

从table往csv, xlsx转化的时候会损失一些信息，用pickle序列化就很少有这个问题

Q：在这个问题里具体损失了什么信息。

建议2：

Pandas可以直接连接SQL
最佳实践是建议先用SQL做前期工作（特别是join生成新表），然后再导入。数据库对join有优化，Pandas理论上很难做到数据库的水平（本质上是把所有数据读内存）。

Guo-Zhang · 2024-02-20T07:11:04Z

Q：在这个问题里具体损失了什么信息
打开Csv时显示DtypeWarning: Columns (0,3,4,8,10,11,19) have mixed types.
有一些乱码和重复值，去掉这部分以后剩下的数据应该和SQL里是一样的。但是id里面既有int也有str，我当时没发现这一点，所以导致很多数据没匹配上。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

SQL数据转换CSV丢失数据 #1

SQL数据转换CSV丢失数据 #1

Guo-Zhang commented Feb 19, 2024

Guo-Zhang commented Feb 20, 2024

SQL数据转换CSV丢失数据 #1

SQL数据转换CSV丢失数据 #1

Comments

Guo-Zhang commented Feb 19, 2024

Guo-Zhang commented Feb 20, 2024