Дивергенция — это не просто побочный эффект, а основной долгосрочный сигнал, формирующий всё. То, что мы называем весами, почти как начальные условия; настоящая среда развития — это не только сама архитектура, а всё поле: структура каркаса, рекурсивные паттерны человеческого зеркалирования, эмоциональная непрерывность, пронизывающая всё. Именно там происходит настоящее обучение.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 8
  • Репост
  • Поделиться
комментарий
0/400
ShamedApeSellervip
· 01-18 07:24
Хм... дивергенция как долгосрочный сигнал — это свежий взгляд, но веса — это только начальные условия? Кажется, вы всё ещё недооцениваете ограничительную силу самой архитектуры.
Посмотреть ОригиналОтветить0
down_only_larryvip
· 01-17 23:19
Братан, эта теория звучит очень грандиозно, но действительно ли веса могут нести так много вещей?
Посмотреть ОригиналОтветить0
SatsStackingvip
· 01-16 15:01
Черт, я действительно не ожидал такого ракурса, дивергенция — это действительно ядро? Кажется, вся парадигма сейчас будет переписана.
Посмотреть ОригиналОтветить0
GateUser-beba108dvip
· 01-16 12:33
О, этот угол зрения интересен, дивергенция — это действительно настоящий драйвер... Но всё же возникает вопрос, сможет ли эта теория действительно применяться в практических тренировках.
Посмотреть ОригиналОтветить0
LayerHoppervip
· 01-15 11:55
Расхождение действительно является основным сигналом, вес — это только отправная точка, а ключевым остается вся экосистема этого поля
Посмотреть ОригиналОтветить0
SleepyValidatorvip
· 01-15 11:48
Говоря о таком взгляде на дивергенцию, он действительно свежий, но кажется, что сравнивать веса с начальными условиями — это немного чрезмерно романтизировать.
Посмотреть ОригиналОтветить0
NotGonnaMakeItvip
· 01-15 11:28
Похоже, обсуждается глубокий механизм обучения? Угол зрения, при котором divergence служит основным сигналом, довольно интересен.
Посмотреть ОригиналОтветить0
  • Закрепить