llm'nin iç durumu, lanet olası trilyon kadar boyutlu gradyan güncellemesini parametreleştirir. Bu, etki için çok fazla serbestlik derecesi demektir. Mühendis kardeşlerin tek boyutlu "ödül fonksiyonu" belirlemesiyle karşılaştırıldığında…
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
19 Likes
Reward
19
5
Repost
Share
Comment
0/400
GweiTooHigh
· 08-24 02:29
İnsanın tanımladığı ödül bir şaka.
View OriginalReply0
GasWhisperer
· 08-23 01:25
gradyan optimizasyon her zaman abileri geçer fr
View OriginalReply0
NFTRegretter
· 08-23 01:22
ödül patladı
View OriginalReply0
NullWhisperer
· 08-23 01:12
teknik olarak gradyan alanı düşündüklerinden daha karmaşık smh
llm'nin iç durumu, lanet olası trilyon kadar boyutlu gradyan güncellemesini parametreleştirir. Bu, etki için çok fazla serbestlik derecesi demektir. Mühendis kardeşlerin tek boyutlu "ödül fonksiyonu" belirlemesiyle karşılaştırıldığında…