Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- cleancode
- 읽기쉬운코드
- 애자일기법
- 알고리즘
- API
- 그리디알고리즘
- 개발자
- Java
- 클린코드
- Spring
- 엘라스틱서치
- 자바
- framework
- 코딩
- 스프링
- Baekjoon
- 코드
- ES
- database
- 개발
- 데이터베이스
- spring boot
- 그리디
- JPA
- 백준
- mongoDB
- 프레임워크
- 코딩테스트
- 애자일프로그래밍
- Elasticsearch
Archives
- Today
- Total
목록엘라스틱서치 분석기 (1)
튼튼발자 개발 성장기🏋️

텍스트 분석 개요 엘라스틱서치는 루씬을 기반으로 구축된 텍스트 기반 검색엔진이다. 루씬은 내부적으로 다양한 분석기를 제공하는데 엘라스틱서치는 루씬이 제공하는 분석기를 그대로 활용한다. 그렇기 때문에 이 분석기를 어떻게 동작하는지 이해하고 구성하는 것이 중요하다. "우리나라가 좋은나라, 대한민국 화이팅" 문장이 있다고 가정해보자. 이 문장을 검색하기 위해 "대한민국"이라고 입력한다면 "우리나라"라는 단어가 존재하지 않기 때문에 검색이 되지않는다. 엘라스틱서치는 문서를 색인하기 전에 해당 문서의 필드 타입이 무엇인지 확인하고 텍스트 타입이면 분석기를 통해 이를 분석한다. 텍스트가 분석되면 개별 텀으로 나뉘어 형태소 형태로 분석이 수행된다. 해당 형태소는 특정 원칙에 의해 필터링되어 단어가 삭제되거나 추가/수..
Reading/엘라스틱서치 실무 가이드
2023. 12. 10. 19:22