Data Stratification Strategy

음성 데이터는 노이즈가 아닙니다.
정량 데이터(생체 및 임상 측정값)가 놓치는 '전조 증상'을 가장 먼저 포착하는
조기 감지 레이더
입니다.

Core Logic: 조기 신호 vs 확증 신호

🤖 생체 및 임상 측정값(바이탈·대사 수치 등)

  • 특징: 정확함, 주기적, 안정적
  • 한계: 증상이 심각해져야 수치로 나타남 (Late)
  • 역할: 진단의 확증(Confirmation)

🗣️ 정성 데이터 (Voice/Obs)

  • 특징: 빠름, 거칠음, 풍부한 맥락
  • 장점: 수치 변화 전 '미묘한 상태' 포착 (Early)
  • 역할: 위험의 전조 감지(Early Warning)
"정확도 90% vs 92%의 싸움이 아닙니다.
위험 신호를 하루라도 더 빨리(T-Minus) 잡아낼 수 있느냐의 싸움입니다."

Architecture: 데이터 신뢰도 계층화

엔진은 데이터를 평면적으로 처리하지 않습니다. 신뢰도와 속도에 따라 계층적으로 가중치를 부여합니다.

Layer 3 (Top)
음성 기반 관찰 (Voice)
성격: 빠름, 거칠음
기능: 조기 신호 (Early Signal) 트리거
Layer 2 (Middle)
구조화 기록 (Input)
성격: 중간 신뢰도
기능: 컨텍스트 연결 (Context)
Layer 1 (Bottom)
생체 및 임상 측정값
성격: 느림, 매우 정확함
기능: 확증 신호 (Confirmation) 및 경보 발령

Value: 의미 기반 리스크 추론

정량 데이터(바이탈·대사 수치)로는 절대 잡을 수 없는 전구 증상(Early Prodrome)은 오직 언어로만 포착됩니다.

🧠
Semantic Risk Reasoning

"오늘따라 멍하시네..." (The Gap)

혈압은 정상이지만, 섬망, 우울, 기능 저하, 사고 발생은 말과 행동 묘사에서 먼저 나타납니다.
세만AI는 음성을 노이즈가 아닌, 확률 가중치를 조정하는 핵심 변수로 활용합니다.

Conclusion: 시간 축의 감각기관

T-10: "기운이 없어 보임"
(음성감지: 확률적 위험 상승)
T-2:바이탈·대사 수치변화
(임상적 이벤트 전조)
T-0: 낙상/쇼크 발생
(위험 확정)
Time Start Future
"둘 중 하나를 선택하는 것이 아닙니다.
음성정량(계측 및 측정)데이터시간 축에서 서로 다른 역할을 하는 감각기관입니다."
FUTURE ROADMAP

STT는 영원히 '보조 수단'일까?

현재의 '확률적 가중치를 조정하는 변수(STT 데이터 활용 제약(Constraint))'가 미래의 '독립 예측 변수(Feature)'로 승격하는 과정.
데이터 축적에 따른 ML/DL 확장 로드맵을 확인하세요.