본문 바로가기
카테고리 없음

[KDC] 빅데이터 분석 첫걸음 시작하기 : 데이터분석 인강 2주차

by Fresh Red 2022. 6. 27.
728x90
반응형

벌써 1주 차 공부가 끝나고 2주 차 강의도 다 들었다.

1주 차는 빅데이터에 다루고 컴퓨터를 이용해 파이썬을 사용하기 위해 설치 과정을 경험해 보고 데이터 타입인 변수, 숫자, 문자열 등등 배웠다면 2주 차에서는 배웠던 데이터 타입들을 편하게 사용하기 위한 연속형 데이터에 대해 배웠다.

Sequential Data Types

연속형 데이터 타입이 어떤것들이 있는지부터 특징을 파악하여 각자의 용도에 맞게 사용하는 법을 배웠다. 

예를 들어 만개의 숫자형/문자형 데이터를 일일히 다루며 작성하여 사용하는 것보다, 이 만개의 데이터를 연속형 데이터 타입에 저장하고 변수에 지정하여 한번에 불러와서 사용할 수 있는 것 같은 방법을 배웠다.

List, Tuple, Set, Dictionary

강의를 들으면서 리스트와 튜플을 직접 만들고 사용해 보며, 두 종류는 비슷하면서도 다르다는 것을 느꼇다.

다른 점은 꼽자면 둘은 생긴 것이 달랐고, 리스트는 언제든지 변경이 가능하지만 튜플을 변경할 수 없다는 것

밑에 예시를 적어 놓았다.

# 리스트 # 대괄호 사용
L = [1, 2, 3, 4] -> L = [1, "apple", 3, 4] -> L = ["earth", "apple", 10, 15] # 변경가능

# 튜플 # 중괄호 사용
T = (1, 2, 3, 4) -> T = ("beta", 10, 15, 20) # 변경 불가능 # 에러가 남

사칙연산을 이용해 두 타입들이 어떻게 변하는지도 보았고 함수를 이용해 원소를 추가해 보기도 하고 직접 리스트를 바꿔보기도 하며 생각보다 간단하다고 느끼기도 했지만 고등 과정에서 사용한다면 이것마저도 어려울 것을 알기에 집중했던 것 같다.

리스트 관련 함수: 리스트에 원소 추가하기

집합과 사전을 만들 때 사용하는 공통점은 중괄호라는 거지만 둘의 쓰임새는 다름을 배웠다.

집합은 공집합 같은 개념이었고 사전은 우리가 생각하는 사전이랑 똑같았던 것 같다.

이 두 가지도 훑어보았고, 만들어 보며, 사용해 보았다.

특히 사전은 강사님도 많이 사용될 거라고 하셔서 개념은 이해해도 직접 연습해 보며 값을 변경하고 이용해 보기도 했다.

Programming Practice

여기까지는 강의를 보며 같이 코드를 작성했지만, 문제 풀이들을 들어가며 심화과정에 들어가는 느낌을 받았다.

여태까지 배웠던 내용들을 사용해 문제를 다 풀어야 했는데, 함수를 사용할 수 있기에 간단하게 풀 수 있는 문제도 있었지만, 여러 개념을 응용해 사용하는 문제도 있어서 어려웠던 문제들도 많았고, 풀이 방법을 글로는 써 볼 수 있었지만 코드로는 작성을 하지 못했기에 구글에 찾아보거나 풀이과정을 봐야 했던 문제들도 있었다.

혹시나 윈도에서 이런 에러가 날 수도 있다.

유니코드 에러

찾아보니 에러가 나는 이유가 파이썬 3은 텍스트 (. txt) 파일을 유니코드가 아닌 ANSI로 읽기 때문이라고 했다.

만약 이런 에러가 난다면 파일명 옆에 이렇게 추가해 주면 된다:

"data/contents_text_파이썬.txt" # 유니코드 에러 남
"data/contents_text_파이썬.txt" ,"r", unicode="utf-8" # 고쳐진 후

이렇게 문제를 다 푼 후에는 다음 과정으로 넘어갔다.

Python 기초 문법

데이터 타입에 대해 배우고 문제도 풀어보고 나니 이제 문법으로 들어갔다.

조건문인 'if'를 먼저 배웠고, 그 후 반복문인 'while'과 'for'를 배웠다.

여기서부터 조금씩 어려워지기 시작했던 것 같다.

보고 들을땐 이해가 가지만 직접 풀어보면 헷갈릴 때가 많았기에 많은 연습이 필요했다.

기초 문법 문제는 4개밖에 없었지만 전에 개념을 잡으면서 많이 연습이 필요했기에 더 어려웠던 것 같다.

그렇지만 그저 답만 보고 문제를 이해할 순 없었기에, 이번 문제 풀이 과정에서는 최대한 찾아보지 않고 논리적으로 풀어보려 했던 것 같다.

당연히 이번 문제집도 간단한 문제도 있었고, 온라인에 찾아봐야 할 만큼 응용할 것이 많은 문제도 있었다.

논리적이라고 생각하며 작성한 코드가 원하는 답을 제시하지 않을 땐 답답함도 많이 느꼈지만, 그저 보고 듣고 쓰는 것만이 아닌 직접 풀어 보는 과정이 있었기에 많은 도움이 된 거 같았다.

 

다음으로는 함수에 대해서 배웠고 함수를 만들어 보기도 하였다.

뭔가를 어디에 저장하고 불러온다는 것이 많이 유용하면서도, 데이터 타입에서 배운 변수를 생각나게 해 준 거 같다.

File I/O & Numpy

기초 문법을 마친 후엔 파일을 파이썬을 이용해 불러오고 내보내는 과정에 기초 지식을 훑어보았고, 많이 쓰인다는 넘파이에 대해 배웠다.

넘파이에서 사용하는 여러 함수들을 작성해보며 넘파이 특징에 대해 들었지만 약간 훑어가는 듯한 느낌은 받았다.

그래도 강의 중에는 혼자서 직접 문제를 풀며 데이터를 다루지는 않았지만 강사님의 설명과 더불어 데이터를 사용하는 법을 보니 조금씩 이해가 가기 시작했다.

매트릭스를 이용하고 계산하는 법도 배웠고 1차원 2차원에 대해서도 배웠다.

 

2주 차는 1주 차보다 들어야 할 강의도 더 많았고 배워야 할 것도 훨씬 많았기에 이 글에 다 담지 못했지만 개인적인 생각으로는 2주 차가 이론적으로 배우는 것이 제일 많았을 것 같다.

꼭 복습을 해야겠다, 특히, 파이썬 기초 문법, 함수, 그리고 넘파이에 대해 좀 더 자세히 공부를 해봐야 할 것 같다.

728x90
반응형

home top bottom
}