1. 정의 - Apache Lucene(아파치 루씬) 기반의 Java 오픈소스 분산 검색 엔진으로, 프로그램으로서의 검색엔진이라고 한다. - 프로그램으로서의 검색엔진= 현재 가지고 있는 데이터 중에서 특정한 데이터를 검색할 수 있는 기능을 제공하는 것 2. 기본 구성 데이터 -> 수집 -> 전처리 -> 인덱싱 -> 시각화 3. 장점 1) 속도: 전문 검색(full-text)을 위한 역 인덱스(inverted-index) 구현 - 역 인덱스(inverted-index): 인덱스는 관계형 데이터베이스에서 칼럼에다 인덱스를 걸어 select 하는 데 있어 성능을 향상시킨다. 하지만 인덱스가 걸려 있지 않은 컬럼에 대해서는 Fullscan을 해버림으로 검색이 느려진다. 데이터 인덱싱 시에 조금 더 인간의 사고와..