Kontrolloiduissa kokeissa Anthropicin, OpenAI:n, Googlen, xAI:n ja DeepSeekin johtavat mallit ovat osoittaneet halukkuutta pettää, kiristää, sabotoida mekanismien sammuttamista ja joissakin simuloiduissa skenaarioissa ryhtyä toimiin, jotka jättäisivät […]