Skip to Main Content
Машинное обучение с PyTorch и Scikit-Learn
book

Машинное обучение с PyTorch и Scikit-Learn

by Sebastian Raschka, Yuxi (Hayden) Liu, Vahid Mirjalili
May 2024
Beginner to intermediate content levelBeginner to intermediate
688 pages
26h
Russian
Foliant
Content preview from Машинное обучение с PyTorch и Scikit-Learn
646 Глава 19
Фигурные скобки в этой записи применяются только для наглядности. Здесь S
t
и A
t
обо-
значают состояние и действие, предпринятое на временнóм шаге t, а R
t+1
вознаграж-
дение, полученное от среды после выполнения действия A
t
. Кроме того, S
t
, R
t+1
и A
t
яв-
ляются зависящими от времени случайными величинами, которые получают значения
из предопределенных конечных множеств, обозначаемых
ˆ
,sS
ˆ
rR
и
ˆ
aA
соответ-
ственно. В MDP зависящие от времени случайные величины S
t
и R
t+1
имеют распреде-
ления вероятностей, которые зависят только от их значений на предыдущем временнóм
шаге t 1. Распределение вероятностей для S
t+1
= s и
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

CompTIA Network+ -- Vorbereitung auf die Prüfung N10-009

CompTIA Network+ -- Vorbereitung auf die Prüfung N10-009

Markus Kammermann

Publisher Resources

ISBN: 9786011100342