我正在使用 pyodbc 与 Azure Synapse SQL DW 建立连接。连接已成功建立。但是,在将 pandas 数据框插入数据库时,当我尝试将多行作为值插入时出现错误。但是,如果我一一插入行,它就会起作用。将多行作为值插入到一起,在 AWS Redshift 和 MS SQL 中可以正常工作,但在 Azure Synapse SQL DW 中失败。我认为 Azure Synapse SQL 是 T-SQL 而不是 MS-SQL。尽管如此,我也找不到任何相关文件。
我有一个名为“df”的熊猫 df,如下所示:
student_id admission_date
1 2019-12-12
2 2018-12-08
3 2018-06-30
4 2017-05-30
5 2020-03-11
下面的代码工作正常
import pandas as pd
import pyodbc
#conn object below is the pyodbc 'connect' object
batch_size = 1
i = 0
chunk = df[i:i+batch_size]
conn.autocommit = True
sql = 'insert INTO {} values {}'.format('myTable', ','.join(
str(e) for e in zip(chunk.student_id.values, chunk.admission_date.values.astype(str))))
print(sql)
cursor = conn.cursor()
cursor.execute(sql)
如您所见,它仅插入 1 行“df”。所以,是的,我可以循环并一一插入,但是当涉及到更大尺寸的数据帧时,它会花费很多时间
当我尝试将所有行一起插入时,下面的代码不起作用 import pandas as pd import pyodbc
batch_size = 5
i = 0
chunk = df[i:i+batch_size]
conn.autocommit = True
sql = 'insert INTO {} values {}'.format('myTable', ','.join(
str(e) for e in zip(chunk.student_id.values, chunk.admission_date.values.astype(str))))
print(sql)
cursor = conn.cursor()
cursor.execute(sql)
我在下面得到这个错误:
ProgrammingError: ('42000', "[42000] [Microsoft][ODBC Driver 17 for SQL Server][SQL Server]第 1 行第 74 列解析错误:',' 附近的语法不正确。(103010) (SQLExecDirectW) ")
这是失败的 2 行的示例 SQL 查询:
insert INTO myTable values (1, '2009-12-12'),(2, '2018-12-12')