Skip to Content
스파크를 이용한 자연어 처리 : 대규모 텍스트를 다루는 가장 효율적인 딥러닝을 만나다
book

스파크를 이용한 자연어 처리 : 대규모 텍스트를 다루는 가장 효율적인 딥러닝을 만나다

by 이창현, 앨릭스 토머스
August 2021
Beginner to intermediate content levelBeginner to intermediate
440 pages
10h 4m
Korean
Hanbit Media, Inc.
Content preview from 스파크를 이용한 자연어 처리 : 대규모 텍스트를 다루는 가장 효율적인 딥러닝을 만나다
358
3
애플리케이션
'_id': 'eHmWYG4BfVJ3yetiIs2m',
'_score': 45.704754,
'_source': {'title': 'Data collection'}}]}}
이제 쿼리 함수를 구축해보자.
Fields
인수는 필드 이름 및 부스트의 튜플 목록이다.
부스트
본질적으로 다른 필드에 대한 인덱스에서 반환된 점수에 적용되는 가중치다.
def query_index(query, fields=None, size=10):
data = spark.createDataFrame([(text,)], ('text',))
row = nlp_pipeline.transform(data).first()
query = row['normalized'][0]
if fields is None:
fields = [('normalized', 1), ('title', 10)]
headers = {
'Content-Type': 'application/json',
}
params = (
('pretty', ''), ('size', size)
)
data = {
"_source": ['title'],
"query": {
"multi_match": {
"query": query,
"fields": ['{}^{}'.format(f, b) for f, b in ...
Become an O’Reilly member and get unlimited access to this title plus top books and audiobooks from O’Reilly and nearly 200 top publishers, thousands of courses curated by job role, 150+ live events each month,
and much more.
Start your free trial

You might also like

클라우드 네이티브: 클라우드 네이티브 애플리케이션을 설계, 개발, 운영하는 핵심 가이드

클라우드 네이티브: 클라우드 네이티브 애플리케이션을 설계, 개발, 운영하는 핵심 가이드

정원천, 보리스 숄, 트렌트 스완슨, 피터 야우쇼베츠

Publisher Resources

ISBN: 9791162244654