
Трансформеры: улучшение обработки естественного языка с помощью механизмов внимания
563
После завершения обучения, которое может занять до часа в зависимости от вашего
графического процессора, мы можем вызвать
trainer.evaluate()
, чтобы получить произ-
водительность модели на тестовом наборе:
>>> print(trainer.evaluate())
***** Запу ск оценки *****
Кол-во при меров = 10000
Размер пак ета = 16
100%|█████ █████████████ ███████████████ ████████| 625/625 [10:59<00:00, 1.06s/
it]
{'eval_loss': 0.30534815788269043,
'eval_accuracy': 0.9327,
'eval_runtime': 87.1161,
'eval_samples_per_second': 114.789,
'eval_steps_per_second': 7.174,