728x90
반응형
No One Truly Knows How AI Systems Work. A New Discovery Could Change That
MAY 21, 2024 11:00 AM EDT
사실 나도 AI를 공부하는 사람으로써, 데이터 분석의 결과나 모델링 코드는 알고 있지만 안에 어떻게 돌아가는지, 안전성은 어떤지 잘 모른다. 명확한 과정과 답을 고민하는 것에 성취감을 느끼는 사람으로써 늘 답답한 부분이기도 했다.
근데 이 뉴스는 이제 AI의 내부를 볼 수 있고, 뉴런을 억압하는 방법을 통해 안전성을 확인할 수 있다는 뉴스였다.
아직은 작은 모델에서 시작하고 많이 나아가지 못했지만 금방 큰 모델에 내부를 파악하고 안전성을 파악할 수 있을 가능성이 보여 이제 AI의 내부 실체를 더 명확히 파악할 수 있을 것이다. 큰 기대가 보이는 뉴스였다.
explicit 명백한
feed in 먹이다
spot 찾아내다
opaque 불투명체
loom 다가오다
breakthrough 돌파구
stimulate 자극하다
exploit 악용되다
vulnerability 취약성
suppress 억압하다
implication 함축
fraudulent 사기적인
speculative 위험한
wreak 가하다
havoc 큰 파란
intervention 간섭
struck 치다
optimistic 낙관적인
promising 유망한
peer into 들여보내다
fire 활성화되다
disparate as 서로 다른
indeication 표시
nowhere 아무데도
manipulate 조종하다
utility 유용
esoteric 난해한
링크
https://time.com/6980210/anthropic-interpretability-ai-safety-research/
반응형