Tom Nakayama
banner
txmy.bsky.social
Tom Nakayama
@txmy.bsky.social
ベンチマーク(日本語のMT-Bench)でKARAKURI LMを上回っているモデル、実際に使うとかなり微妙感あるので、やはりベンチマークのスコアはあてにならない。じゃあ人間評価はどうかというと、日本語版Chatbot Arenaは評価数が足りなすぎて全然あてにならない。
March 24, 2024 at 2:58 PM
7Bモデル、やっぱり難しさがある。
March 2, 2024 at 10:21 AM
世界に負けないのLLM作りたいという話をしても信じてくれるのはウチの成果を知ってるごく一握りしかいない。詳しくない人たちにもわかりやすい成果を出して知名度あげていきたさがある。
February 17, 2024 at 11:44 AM
この株とこの株は買っておきたいなーって思ったり、色々考えるのは好きなんだけど、いかんせん先立つ物がなく結局買わずに何年も経っている。
February 11, 2024 at 3:19 PM
京都に来た
February 10, 2024 at 1:53 PM
いつも行ってる沖縄そばの店が長期で休んでたので、久しぶりに近くにあった家系ラーメン食べたけど美味しい〜!!!家系やっぱり好きだなぁ。ほうれん草食べれるし。
February 9, 2024 at 1:34 PM