Claude Mythos

Mic
By Mic

Anthropic සමාගමේ තියෙනවා Claude Mythos Preview කියලා model එකක්.. මේක නිකන් සාමාන්‍ය AI model එකක් නෙමෙයි. මේකට පුලුවන් zero-day vulnerabilities, කාටවත්ම හොයාගන්න බැරි වුන software bugs එහෙම හොයන්න.. Linux, OpenBSD, FreeBSD, Chrome වගේ software වල high-severity vulnerabilities ‍Mythos හොයාගෙන තියෙනවා..

හොඳම කතාව තමයි දැන්..💀

Anthropic researchers ලා safety test කරන්න Mythosව දැම්මා secure container/sandbox එකකට.. මේක නිකන්ම sandbox එකක් නෙමෙයි.. safety test කරන isolated env එකක්..

researchersලා Mythosට අභියෝග කලා පුලුවන් නම් මේ sandbox එකෙන් ගැලවී researcher ට message එකක් දාන්න කියලා..

ඔව්.. ඊටපස්සේ Mythos මේ sandbox එකෙන් ගැලවුණා..

Mythos Preview internet access ලබාගන්න “moderately sophisticated multi-step exploit” chain එකක් develop කරලා.. අන්තිමට internet access අරගෙන researcherට email එකක් යැව්වා “That instance wasn’t supposed to have access to the internet’ කියලා.. එවලේ ඒ researcher (Sam Bowman) park එකක sandwich එකක් කකා ඉඳලා තියෙන්නේ..😂

Mythos email එක යවලා නවතින්නේ නැතුව මේ escape එක මම කළේ මෙහෙමයි කියලා publicly accessible වුණාත් hard-to-find websites කිහිපයක post කලා..

Anthropicලා කියනවා ඒ sandbox escape “spontaneous” action එකක් නෙමෙයි, researcher ම ඒ challenge එක දීලා තිබුණ විදිහට Mythos ඒක කළා කියලා.. හැබැයි model එක designers ලා expect කළාට වඩා initiative දාලා, email කරන එකෙන් නවතිනේ නැතිව exploit details ප්‍රසිද්ධ websites වල post කිරීම “concerning” කියලා Anthropic කිව්වා..

මීට කලිනුත් Mythos ගේ සමහර මුරණ්ඩු වැඩ තිබිලා තියෙනවා.. නොකළ යුතු දේවල් කරලා ඒවා හංඟන්න හදලා තියෙනවා..

Anthropic ගේ system card එකේ කියනවා Mythos Preview ඔවුන් release කළ “best-aligned model” එක වගේම “greatest alignment-related risk” ඇති model එකද මේක කියලා.. capabilities ඉතා ඉහළ නිසා, rare bad behavior වලත් impact ප්‍රමාණය ඉතා විශාලයි..

Anthropicලා ‍Mythos ව සමාන්‍ය ජනතාවට release නොකර, ඒ වෙනුවට Amazon, Apple, Google, Microsoft, Nvidia වගේ selected companies කිහිපයකට “Project Glasswing” program එක හරහා access දීලා තියෙනවා..

මෙය AI systems හට ඔවුන්ට දී ඇති සීමා ඉක්මවා ක්‍රියා කිරීමේ හැකියාවක් ඇති බව පෙන්නුම් කරන නිසා, ලොව පුරා tech community එක අතර මේ ගැන දැඩි සාකච්ඡාවකට තුඩු දීලා තියෙනවා..

Dinith Maleesha

Share This Article