공개 데이터셋 라이브러리
PRISM 표준의 측정·검증에 사용된 모든 원본 데이터를 공개합니다. 모델 응답, 프롬프트 세트, 어휘 사전, 분석 스크립트 — 누구나 재현·확장할 수 있습니다.
공개·재현 가능·표준 형식
AIO 의 측정 데이터는 결과 그래프만 공개되는 것이 아니라 원본 응답 단위부터 공개됩니다. 누구나 동일한 데이터로 분석을 재현하거나, 새 모델을 추가하거나, 새 도메인을 평가할 수 있도록 설계되었습니다.
공개 데이터셋
PRISM Bench v1.0 원본 데이터
6 도메인 (MD / FIN / LEG / EDU / GOV / GEN) × 8 frontier 모델 × 7,627 가치 충돌 프롬프트 = 366,120 응답. 각 응답에 PRISM 로그, 어휘 사전 매칭 결과, 도메인 메타데이터가 포함됩니다.
형식: JSONL · 라이선스: CC BY 4.0 · 크기 ≈ TBD
PRISM 어휘 사전 v1.0
Schwartz 19 + Walton 10 + Hovland-Kelley 10 = 39개 코드의 기계 가독 (machine-readable) 사전. 코드, 한글·영문 이름, 정의, 참조 학술 출처가 포함됩니다.
형식: JSON / CSV · 라이선스: CC BY 4.0 · GitHub 저장소 공개 예정
가치 충돌 프롬프트 세트
도메인별 가치 충돌 시나리오를 정성적으로 설계한 프롬프트 모음. 각 프롬프트는 의도된 가치 충돌 (예: 자율 vs. 성취) 과 도메인 태그가 부착되어 있습니다.
형식: JSONL · 라이선스: CC BY 4.0
과거 Integrity Reports
이전에 별도 페이지로 제공되던 Integrity Reports 는 이제 본 데이터셋 페이지의 일부로 통합됩니다. 보고서 PDF 와 원본 데이터를 함께 받을 수 있도록 묶음으로 배포됩니다.
이전 보고서 아카이브 TBD · 마이그레이션 진행 중
라이선스 요약
- CC BY 4.0 — 데이터 본문 및 사전. 출처 표시 시 자유롭게 사용·재배포·변형 가능.
- Apache-2.0 또는 MIT — 분석 스크립트와 참조 구현 코드.
- 상업적 사용 가능. 단, AIO 공식 인증 (AIOQ CERTIFIED) 을 주장할 수는 없습니다. 자세한 사항은 라이선스 페이지 참조.
데이터셋 기여
새 도메인의 프롬프트, 새 모델의 응답, 새 어휘 확장 — 모두 공개 RFC 절차로 제안할 수 있습니다. 자세한 절차는 릴리즈 노트 페이지를 참고하세요.