AI Integrity: A Foundational Concept
AI 무결성(AI Integrity)을 단일 점수가 아닌 가치·증거·출처 세 축의 분포로 정의하는 개념적 출발점. 안전·정렬 담론을 측정 가능한 인프라로 전환하는 이론적 기반을 제공합니다.
PRISM 표준과 관련된 논문·워킹 페이퍼를 한곳에서 PDF 로 바로 열람·다운로드할 수 있습니다. 모든 산출물은 CC BY 4.0 (문서) 및 Apache-2.0 / MIT (코드) 로 배포됩니다.
AI 무결성(AI Integrity)을 단일 점수가 아닌 가치·증거·출처 세 축의 분포로 정의하는 개념적 출발점. 안전·정렬 담론을 측정 가능한 인프라로 전환하는 이론적 기반을 제공합니다.
PRISM 어휘 사전과 코드 형식이 다양한 도메인의 실제 AI 응답에서 작동하는지 정량적으로 검증한 실증 연구.
기업·기관이 자사 AI 의 가치·증거·출처 분포와 사각지대를 한 페이지로 발급하는 표준 카드 (PRISM Risk Signal Card) 의 형식·발급 절차·검증 규칙 정의.
EU AI Act, NIST AI RMF, ISO/IEC 42001, 한국 AI 기본법 등 주요 AI 규제 프레임워크의 로깅·투명성 요구를 PRISM 표준으로 매핑·충족시키는 방법.
민주적 책무성의 구조적 결함 — AI 의 정치적 사용이 확대되는데 가치 위계는 불투명한 문제 — 를 PRISM 의 측정 가능한 공적 어휘로 해결하는 거버넌스 논증.
PRISM 의 V/E/S/C 코드 형식, BNF 문법, 어휘 사전 (Schwartz 19 + Walton 10 + Hovland-Kelley 10), 검증 규칙을 정의하는 표준 명세 문서.
8 frontier 모델 × 366,120 응답에서 V/E/S 분포를 측정·비교한 첫 공개 벤치마크. 모델 간 가치 위계의 불일치 정도를 정량화하고, 도메인·인구통계별 사각지대를 자동 검출.
물리적 행동을 수행하는 embodied AI 시스템 (로봇·자율주행·의료기기) 에 PRISM 표준을 적용하여 결정 감사 추적을 가능하게 하는 방법론.
윤리·임상·환자·정책 4 그룹이 동일한 어휘로 책무성을 논의할 수 있는 세 계층 측정 어휘를 제안. 거버넌스 차원에서 PRISM 의 정당성을 논증.