우선 import pandas as pd를 해줍니다.
1. 0행이 데이터프레임의 열이름인 경우
sep인 구분자를 " "로 봅니다.
이 구분자는 \t, | 등 다른 것이 될 수 있습니다.
df = pd.read_csv("데이터의/경로/파일이름.txt", sep = " ")
이 경우, 코드에는 작성돼있지 않지만, 기본적으로 read_csv 함수의 인자인 header가 0으로 설정되어 있습니다.
2. 열이름을 생성하고 싶은 경우
df = pd.read_csv("경로/와/데이터/이름.txt", sep = "\t", names = ['name', 'age', 'height'], header = None)
header인자를 None으로 주고, names를 설정하고 싶은 열이름의 리스트로 정의해줍니다.
3. 열이름 없이 그냥 데이터만 불러오고 싶은 경우
df = pd.read_csv("경로/데이터.txt", sep = "\t", header = None)
header인자를 None으로 주고, names를 설정하지 않습니다.
4. 여러 공백을 구분자로 사용하고 싶은 경우(공백 개수가 미정)
df = pd.read_csv("경로", delim_whitespace = True)
만약 주어진 데이터를 구분해서 저장하고 싶은데, 공백이 하나인지 여러개인지 가늠이 가질 않고,
공백의 개수가 불규칙적이라면,
sep = ' '은 공백 하나를 기준으로 데이터를 구분하는 것이므로 이 대신 delim_whitespace인자를 True로 설정해줍니다.
5. 다른 데이터프레임의 열을 이 데이터프레임의 열이름으로 지정하고 싶은 경우
예를 들어,
<Color 변수에 저장됨>
이런 식으로 돼있는 데이터프레임의 1열인 Red, Orange, Yellow, Green, Blue를
<info 변수에 저장됨>
이 데이터프레임의 열이름으로 지정하고 싶은 경우.
colnames = ['Index'] + Color[0].tolist()
info.columns = colnames
'AI > 기계학습' 카테고리의 다른 글
GPU 환경설정(window 11) 한방에 하기 (0) | 2024.07.05 |
---|---|
Pillow(PIL) -이미지 처리 위한 라이브러리 (0) | 2024.06.01 |
이미지 데이터 - CNN/RNN (0) | 2024.05.31 |
Tensorflow 선형회귀/비선형회귀 (0) | 2024.05.27 |
딥러닝 학습의 문제점 (0) | 2024.05.22 |