Document pipeline

문서 허브

공고문, 신청서, 원문 자료를 한곳에서 보고 수집/추출 상태를 관리합니다. PDF는 바로 추출하고, HWP/HWPX/DOCX는 LibreOffice fallback을 타도록 설계했습니다.

26개 문서 추적 중

지원사업 첨부문서

01_공고문_2026년 가상융합 서비스 실증지원_지정과제(7p 수정).hwp
2026 상생 오픈 이노베이션
텍스트 추출 완료
경기콘텐츠진흥원 공고 페이지
2026 상생 오픈 이노베이션
텍스트 추출 완료
03_사업신청서 양식_2026년 가상융합 서비스 실증지원_지정과제.hwp
2026 상생 오픈 이노베이션
수동 검토 필요
02_사업안내서_2026년 가상융합 서비스 실증지원_지정과제 (7p 수정).hwp
2026 상생 오픈 이노베이션
수동 검토 필요
04_사업비 산정기준_2026년 가상융합 서비스 실증지원_지정과제.hwp
2026 상생 오픈 이노베이션
수동 검토 필요
05_경기콘텐츠진흥원 지원사업 관리 규정.hwp
2026 상생 오픈 이노베이션
수동 검토 필요
미수집
원문 링크
미수집
원문 링크
원문 링크
원문 링크
원문 링크
원문 링크
원문 링크
헤럴드경제 기사
TRYOUT AI 실증사업
미수집
원문 링크
원문 링크
원문 링크
원문 링크
원문 링크

원문 자료 상태

K-me 회사소개서 (2026.04)
K-me의 공간형 인터랙션 포지셔닝, K-me Dance, K-me VisionAI를 설명하는 회사소개서.
텍스트 추출 완료
IR 2026 v1
배경, 시장, 제품, PoC 현황, 팀 관련 내용을 담은 IR 초안.
텍스트 추출 완료
IR 2026 v1.2
공간형 미디어, 인터랙티브 경험 수요, 제품 구조와 로드맵을 다듬은 IR 버전.
텍스트 추출 완료
현재 파이프라인 규칙
  • 가능하면 원본 파일을 바로 읽고, 어렵다면 PDF로 변환한 뒤 텍스트 추출
  • PDF는 pdftotext로 빠르게 처리
  • HWP/HWPX/DOCX/XLSX/PPTX는 LibreOffice fallback 사용
  • 추출 실패 시 “수동 검토 필요”로 남겨서 작업이 끊기지 않도록 설계