Anthropic vindt dat het huidige ‘puntensysteem’ de capaciteiten van LLM’s onvoldoende reflecteren en start een initiatief voor betrouwbaardere benchmarks. ‘Een robuust ecosysteem van evaluaties door...
Het bericht Anthropic wil betrouwbaardere benchmarks voor LLM’s verscheen eerst op ITdaily..