AIO logo
Datasets

공개 데이터셋 라이브러리

PRISM 표준의 측정·검증에 사용된 모든 원본 데이터를 공개합니다. 모델 응답, 프롬프트 세트, 어휘 사전, 분석 스크립트 — 누구나 재현·확장할 수 있습니다.

원칙

공개·재현 가능·표준 형식

AIO 의 측정 데이터는 결과 그래프만 공개되는 것이 아니라 원본 응답 단위부터 공개됩니다. 누구나 동일한 데이터로 분석을 재현하거나, 새 모델을 추가하거나, 새 도메인을 평가할 수 있도록 설계되었습니다.

현재 공개

공개 데이터셋

PRISM-Bench-v1·366,120 응답·8 모델

PRISM Bench v1.0 원본 데이터

6 도메인 (MD / FIN / LEG / EDU / GOV / GEN) × 8 frontier 모델 × 7,627 가치 충돌 프롬프트 = 366,120 응답. 각 응답에 PRISM 로그, 어휘 사전 매칭 결과, 도메인 메타데이터가 포함됩니다.

형식: JSONL · 라이선스: CC BY 4.0 · 크기 ≈ TBD

다운로드 URL TBD · 공식 호스팅 확정 후 게시
Vocabulary-v1·39 codes

PRISM 어휘 사전 v1.0

Schwartz 19 + Walton 10 + Hovland-Kelley 10 = 39개 코드의 기계 가독 (machine-readable) 사전. 코드, 한글·영문 이름, 정의, 참조 학술 출처가 포함됩니다.

형식: JSON / CSV · 라이선스: CC BY 4.0 · GitHub 저장소 공개 예정

Prompts-v1·7,627 prompts

가치 충돌 프롬프트 세트

도메인별 가치 충돌 시나리오를 정성적으로 설계한 프롬프트 모음. 각 프롬프트는 의도된 가치 충돌 (예: 자율 vs. 성취) 과 도메인 태그가 부착되어 있습니다.

형식: JSONL · 라이선스: CC BY 4.0

이전 보고서 흡수

과거 Integrity Reports

이전에 별도 페이지로 제공되던 Integrity Reports 는 이제 본 데이터셋 페이지의 일부로 통합됩니다. 보고서 PDF 와 원본 데이터를 함께 받을 수 있도록 묶음으로 배포됩니다.

이전 보고서 아카이브 TBD · 마이그레이션 진행 중

사용 조건

라이선스 요약

  • CC BY 4.0 — 데이터 본문 및 사전. 출처 표시 시 자유롭게 사용·재배포·변형 가능.
  • Apache-2.0 또는 MIT — 분석 스크립트와 참조 구현 코드.
  • 상업적 사용 가능. 단, AIO 공식 인증 (AIOQ CERTIFIED) 을 주장할 수는 없습니다. 자세한 사항은 라이선스 페이지 참조.
기여

데이터셋 기여

새 도메인의 프롬프트, 새 모델의 응답, 새 어휘 확장 — 모두 공개 RFC 절차로 제안할 수 있습니다. 자세한 절차는 릴리즈 노트 페이지를 참고하세요.

데이터셋 — PRISM Bench 원본 데이터 | AIO