
🎯 베이즈 정리 (Bayes' theorem) - 베이즈 정리는 조건부 확률을 계산하는 방법 중 하나이다. - 사건 A가 일어날 확률 : P(A), 사건 B가 일어날 확률 : P(B) - P(A|B) : 사건 B가 일어나고 나서 사건 A가 일어날 확률, P(B|A) : 사건 A가 일어나고 나서 사건 B가 일어날 확률 -> 나이브 베이즈 분류기는 이러한 베이즈 정리를 이용해 텍스트를 분류 ex) 나이브 베이즈 분류기를 사용해 스팸 메일 필터를 만들기 P(정상 메일 | 입력 텍스트) = 입력 텍스트가 있을 때 정상 메일일 확률 P(스팸 메일 | 입력 텍스트) = 입력 텍스트가 있을 때 스팸 메일일 확률 이를 베이즈의 정리에 따라서 식을 표현하면 다음과 같다. P(정상 메일 | 입력 텍스트) = (P(입력 텍..

본격적인 텍스트 처리를 하기에 앞서 무엇을 단어로써 셀 것인지를 결정해야 한다. 🎯 Corpus A compute-readable collection of text or speech 즉, Corpus란 컴퓨터가 읽을 수 있는 텍스트나 연설의 말뭉치를 의미한다. 예시 1) 문서 Brown corpus : Brown 대학 (Kucera and Francis) 에서 1963-1964 동안 수집한 신문, 소설, 논픽션, 논문 등 다양한 장르의 영어 문서를 500건으로부터 추출한 a million-word collection He stepped out into the hall, was delighted to encounter a water brother. - 문장 부호 제외 : 13단어, 문장 부호 포함 : 15..

Swift 기초 다지기 기본 데이터 타입 / Any , AnyObject, nil 🎯 기본 데이터 타입 - 스위프트는 다른 데이터 타입 간의 변형이 매우 까다롭기 때문에 반드시 명확한 데이터 타입을 설정해주어야 한다. 1. Bool (true or false) var someBool: Bool = true print(someBool) someBool = false 2. Int (정수형) : 양의 정수, 음의 정수, 0 모두 가능 var someInt: Int = -100 print(someInt) someInt = 100 print(someInt) someInt = 0 print(someInt) * 실수값 입력 시 3. UInt (양의 정수) var someUInt: UInt = 100 print(som..

🎯텍스트 처리 - 텍스트로부터 고품질의 정보를 유도하기 위해 필요한 작업 - 텍스트를 가공해서 표준화 된 + 계산 가능한 + 유용한 형태로 변환하는 것 (전처리도 포함) ex) Tokenization - 본질의 의미는 같지만 활용 형태가 다른 단어가 존재 ex) woodchuck = woodchucks = Woodchuck = Woodchucks = ... - 텍스트 처리를 텍스트 분석으로 보는 시각 : 활용 형태가 다른 텍스트 샘플들로부터 패턴을 인식하여 tokenization을 수행 ex) 공백을 활용한 단어의 분리, 단어의 어근을 활용한 정규화 등 🎯 텍스트 정규화 : 텍스트를 이전에 없던 단일 표준 형식으로 변환하는 과정 (1) tokenization (토큰화) 작업 - 텍스트에서 단어를 분리하고..

Swift 기초 다지기 명명법 / 콘솔로그 / 문자열 보간법 / 상수와 변수 🎯 명명법 * Swift 는 대소문자를 구분! Lower Camel Case : function, method, variable, constant ex) someVariavleName Upper Camel Case : type(class, struct, enum, extension, …) ex) Person, Point, Week 🎯콘솔로그 print : 단순 문자열 출력 dump : 인스턴스의 자세한 설명(description 프로퍼티) 까지 출력 🎯문자열 보간법 String interpolation 프로그램 실행 중 문자열 내에 변수 또는 상수의 실질적인 값을 표현하기 위해 사용 \() -> 문자열로 자동 치환 📎예제 코드 ..

🎯NLP(Natural Language Processing : 자연어 처리)란? (컴퓨터를 활용하여) 인간이 일상적으로 사용하는 언어를 처리 및 분석하는 기술로 인공지능의 한 분야로서 머신러닝을 사용하여 텍스트와 데이터를 처리하고 해석하는 것을 의미한다. 자연어 처리의 대표적인 유형으로는 자연어 인식 및 자연어 생성이 있다. 자연어 이해 및 생성에 활용할 수 있는적합한 계산 모델에 대한 연구 자연어 처리의 응용 정보검색 : 키워드검출, 문서 유사도 측정, 문서 랭킹 ex) Google, Yahoo, Naver 질의응답 : 음성인식,의미분석,정보추출 ex) IBM Watson, Apple Siri 기계 번역 ex) 한영/영한, 일한/한일, 중한/한중 맞춤법 검사 ex) 철자교정, 문법 교정 감성분석 소셜 ..