ARTICLES

소프트웨어 설계 및 개발에 관하여 작성한 논문 및 에세이를 공유합니다.

[Essay] 분산 시스템의 필요성

텍스트 마이닝 SaaS 플랫폼 운영 및 시스템 개선을 담당하며, 다수 Worker 서버의 과도한 DB polling으로 인한 CPU 200% 초과 병목과 확장성 문제를 발견. 이를 Master 서버 중심의 gRPC 기반 중앙 집중식 작업 분배 구조로 전환하여 CPU 사용률을 4배 이상 낮추고 Worker 서버를 수십 대까지 안정적으로 확장함으로써 운영 효율성과 서비스 신뢰도를 크게 향상시켰다.

[Paper] HTML Text Extraction Using Frequency Analysis

This study proposes a tag-independent text extraction method that isolates main content by analyzing text frequency to filter out repetitive elements, eliminating the need for manual HTML configuration.