OntoProbe

언어의 메커니즘 연구를 위한 프로브 생성 엔진과 구조화된 프로브 셋.

v1.0 English 공개 · CEFR / JLPT 정렬 · CC BY 4.0

온톨로지 범위

배후의 컴파일된 온톨로지는 16개 어휘 토픽 × 16개 문법 기능 의 매트릭스. CEFR / JLPT 난이도로 등급화된 영어·일본어의 평행 판본으로 구성됩니다.

언어	어휘	문법 패턴	레벨 기준
영어	6,713	1,205	CEFR A1–C2
일본어	13,589	751	JLPT N5–N1
한국어	개발 중	개발 중	TOPIK I–II

컴파일된 온톨로지 전체는 재배포되지 않습니다. 공개 릴리스에는 프로브 생성 엔진과 그것을 운용할 수 있을 정도의 curated source pool 이 포함됩니다.

공개

v1.0 — basic engine output · 2026-05-17

Download ontoprobe-en-v1.0.zip (55 KB)

Zenodo 호스팅 · DOI 10.5281/zenodo.20259675

v1.0 구성

· 272 probe 문장 — 16개 어휘 토픽 × 12 + 16개 문법 기능 × 5
· Top-level 온톨로지 스키마 (16 topic + 16 function 정의)
· 프로브 생성 엔진 (`build_probes.py`, Python ≥ 3.8, 외부 의존성 없음)
· Bundled source pool (어휘 478 + 문법 160 entries)

인용

Cynn, Y. (2026). OntoProbe English Probe Set v1.0 (basic engine output)
  [Dataset]. Zenodo. https://doi.org/10.5281/zenodo.20259675

Roadmap

v1.0 English basic engine output — 공개
v1.x Source pool 확장, 템플릿 추가, bi-axial probe 열거
v2.0 Japanese basic engine output (JLPT N5–N1)
v3.0 Korean basic engine output (TOPIK I–II)

소개

OntoProbe 는 River Bottega 가 개발 / 운영합니다. 16×16 매트릭스 설계, 레벨 정렬, 다국어 컴파일레이션, 프로브 생성 엔진 — 모두 저자의 원작입니다. 정렬 철학은 Cambridge English Profile 프로젝트와 JLPT 레벨 체계의 영향을 받았으며, 둘 다 직접 사용하거나 재배포하지 않습니다.

유사한 선행 작업을 알고 계시면 알려주세요. 2026년 시점, 다국어 2D 온톨로지 매트릭스 + 레벨 등급 + 실행 가능한 프로브 생성 엔진 + 등급별 예문의 조합과 일치하는 공개 릴리스는 확인되지 않습니다.

연락

hello@riverbottega.com