我的问题:
我有一个包含多行数据的文件。我想要try将每一行插入我的数据库,但是如果any的行有问题,我需要回滚整个套件和 kaboodle。但我想跟踪实际的错误,所以我可以这样说,而不是仅仅死在第一个有错误的记录上:
该文件有 42 个错误。
Line 1 is missing a whirlygig.
Line 2 is a duplicate.
Line 5 is right out.
我尝试执行此操作的方法是使用事务,但我遇到一个问题,SQLAlchemy 在 select 上创建隐式事务,显然我并不真正理解 sqlalchemy 如何使用事务,因为我所做的一切似乎都无法按照我想要的方式工作。这是一些演示我的问题的代码:
import sqlalchemy as sa
import logging
from sqlalchemy.orm import sessionmaker
from sqlalchemy.ext.declarative import declarative_base
l = logging.getLogger('sqlalchemy.engine')
l.setLevel(logging.INFO)
l.addHandler(logging.StreamHandler())
engine = sa.create_engine('YOUR PG CONNECTION HERE')
Session = sessionmaker(bind=engine)
session = Session()
temp_metadata = sa.MetaData(schema='pg_temp')
TempBase = declarative_base(metadata=temp_metadata)
class Whatever(TempBase):
__tablename__ = 'whatevs'
id = sa.Column('id', sa.Integer, primary_key=True, autoincrement=True)
fnord = sa.Column('fnord', sa.String, server_default=sa.schema.FetchedValue())
quux = sa.Column('quux', sa.String)
value = sa.Column('value', sa.String)
def insert_some_stuff(session, data):
value = session.query(Whatever.value).limit(1).scalar()
session.add(Whatever(quux=data, value='hi'))
try:
session.commit()
errors = 0
except sa.exc.IntegrityError:
session.rollback()
errors = 1
return errors
with session.begin_nested():
session.execute('''
CREATE TABLE pg_temp.whatevs (
id serial
, fnord text not null default 'fnord'
, quux text not null
, value text not null
, CONSTRAINT totally_unique UNIQUE (quux)
);
INSERT INTO pg_temp.whatevs (value, quux) VALUES ('something cool', 'fnord');
''')
w = Whatever(value='something cool', quux='herp')
session.add(w)
errors = 0
for q in ('foo', 'biz', 'bang', 'herp'):
with session.begin_nested():
errors += insert_some_stuff(session, q)
for row in session.query(Whatever).all():
print(row.id, row.fnord, row.value)
我尝试过多种组合session.begin()
or .begin(subtransactions=True)
,但它们要么不起作用,要么看起来很奇怪,因为我正在提交我从未(明确)启动的事务。
我可以阻止 sqlalchemy 在 select 上创建事务吗?或者我在这里遗漏了什么?有更好的方法来实现我想要的吗?