빅데이터 분석기사 필기 기출 정리 분석 변수의 전처리 방법 : 데이터 정제, 데이터 통합, 데이터 축소, 데이터 변환 (삭제 X) 개인정보 판단기준 - 생존하는 개인에 관한 정보 - 개인에 관한 정보 (법인 한정 X) - 정보의 내용이나 형태 등은 제한이 없음 - 개인을 알아볼 수 있는 정보 - 다른 정보와 쉽게 결합하여 개인을 알아볼 수 있는 정보도 포함 데이터 적재 완료 테스트를 위한 정형 데이터 체크리스트 : 테이블의 개수, 속성의 개수, 데이터 타입의 일치여부, 레코드 수 일치 여부 (파티션의 개수X) 데이터 비식별화 방법 : 가명처리 (휴리스틱 가명화, 암호화, 교환 방법), 총계처리, 데이터 삭제, 데이터 범주화(제어 라운딩), 데이터 마스킹 (데이터 표본화 X) 익명화(Anonymizatio..
🌵 관련 문제 🥈[백준 알고리즘 17478번 : 재귀함수가 뭔가요?] https://www.acmicpc.net/problem/17478 17478번: 재귀함수가 뭔가요? 평소에 질문을 잘 받아주기로 유명한 중앙대학교의 JH 교수님은 학생들로부터 재귀함수가 무엇인지에 대하여 많은 질문을 받아왔다. 매번 질문을 잘 받아주셨던 JH 교수님이지만 그는 중앙대 www.acmicpc.net [SOLUTION] https://gyurisinzorba.tistory.com/33 [Python] 백준 알고리즘 17478번 : 재귀함수가 뭔가요? https://www.acmicpc.net/problem/17478 17478번: 재귀함수가 뭔가요? 평소에 질문을 잘 받아주기로 유명한 중앙대학교의 JH 교수님은 학생들로부터..
https://www.acmicpc.net/problem/10994 10994번: 별 찍기 - 19 예제를 보고 규칙을 유추한 뒤에 별을 찍어 보세요. www.acmicpc.net 👩💻문제 이해 재귀함수를 이용한 문제는 패턴을 파악하는게 가장 중요하다. 하지만 아직 문제를 보자마자 패턴을 파악하는게 쉽진 않다. 나름대로 재귀함수 문제를 풀 때 로직을 조금 더 쉽게 알아차릴 수 있는 방법을 생각해봤는데, 대부분의 재귀함수는 정의된 함수의 변수를 n이라고 할 때 (n-1)을 변수로 가지는 함수를 호출한다. 따라서 n 일때와 n-1 일 때의 출력을 비교하며 로직을 찾으면 좀 더 쉽게 찾을 수 있을 것이다. n이 4일 때의 출력을 예로 들어보자면 가장 바깥 쪽의 라인(n) -> 행과 열이 (4*n -3)개 -..
https://cbt.youngjin.com/ 이기적 CBT, 영진닷컴 cbt.youngjin.com CRISP-DM 분석 방법론 업무 이해 -> 데이터 이해 -> 데이터 준비 -> 모델링 -> 평가 -> 전개 정성적 데이터 vs 정량적 데이터 - 정성적 데이터 : 언어나 문자로 표현된 데이터, 비정형 데이터로 비구조화된 데이터 ex) 쿠팡의 리뷰, 인터뷰, 언론 보도 - 정량적 데이터 : 수치, 도형, 기호 등 바로 측정할 수 있는 데이터 key-value 데이터베이스 - 단순한 데이터 모델에 기반 - 관계형 데이터베이스보다 확장성 뛰어남 - 질의응답 시간도 빠름 계층적 프로세스 모델 단계(Phase) -> 태스크(Task) -> 스텝(Step) NoSQL 데이터베이스 저장 방식 - key-value ..
https://www.acmicpc.net/problem/11729 11729번: 하노이 탑 이동 순서 세 개의 장대가 있고 첫 번째 장대에는 반경이 서로 다른 n개의 원판이 쌓여 있다. 각 원판은 반경이 큰 순서대로 쌓여있다. 이제 수도승들이 다음 규칙에 따라 첫 번째 장대에서 세 번째 장대로 www.acmicpc.net 👩💻문제 이해 재귀함수 알고리즘을 이용해 하노이 탑 이동순서를 출력하고 이동 횟수를 구하는 문제이다. 재귀함수는 어떤 패턴이 반복되는지 찾아내는 게 중요하다 1번지점에서 3번지점으로 탑을 옮기기 위해선 위 그림과 같은 3개의 단계가 반복된다. 1단계 : n-1개의 원판을 1 -> 2 이동 2단계 : 남은 한 개의 원판을 1 -> 3 이동 3단계 : n-1개의 원판을 2 -> 3 이동..
데이터사이언스를 위한 통계학입문Ⅰ https://pabi.smartlearn.io/courses/course-v1:POSTECH+DSB111+P2203/about 데이터사이언스를 위한 통계학입문Ⅰ pabi.smartlearn.io IV. 빅데이터 분석에서 확률과 분포 4.1 확률의 기초개념 통계 : 데이터를 수집, 처리, 분석, 활용하는 지식 -> 실제 얻어진 데이터를 바탕으로 정보를 도출 확률 : 어떤 특정한 사건이 일어날 가능성을 0과 1사이의 값으로 나타낸 것 -> 관측하기 전에 있어서 가능성을 논하는 것 통계에서 필요한 확률 - 확률, 사건, 표본공간 확률 : 어떤 특정한 사건이 일어날 가능성을 0과 1사이의 값으로 나타낸 것 사건 : 표본공간에서 관심의 대상인 부분집합 표본공간 : 확률 실험의 ..