ANHANG A
Die Feinheiten
In diesem Anhang beschäftigen wir uns detailliert mit einigen technischen Bereichen, die aus Gründen der Vollständigkeit wichtig, aber nicht zwingend nötig sind.
Matrix-Kettenregel
Wir beginnen mit einer Erklärung dazu, warum wir im Kettenregelausdruck in Kapitel 1 (X) durch WT ersetzen können.
Wörtlich genommen, entspricht L:
σ(XW11) + σ(XW12) + σ(XW21) + σ(XW22) + σ(XW31) + σ(XW32)
Dies ist wiederum eine Kurzschreibweise für die Tatsache, dass:
σ(XW11) = σ(x11 × w11 + x12 × w21 + x13 × w31)
σ(XW12) = σ(x11 × w12 + x12 × w22 + x13 × w32)
… und so weiter. Zoomen wir näher an einen dieser Ausdrücke heran. Wie würde er aussehen, ...
Get Deep Learning – Grundlagen und Implementierung now with the O’Reilly learning platform.
O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.