[Python] dataset 을 다루는 자료형
1. 리스트 자료형
- 대괄호 안에 각 항목을 콤마로 구분하여 사용한다.
ex) data = [1, 2, "3", 4]
- 대괄호 안에 또 다른 대괄호를 넣어 사용할 수 있다.
ex) data = [1, 2, "3", 4, [5, 6, "7"]]
- 리스트 변수명에 대괄호를 사용하여 순번을 넣어 출력하면 각 순서에 해당하는 항목을 출력할 수 있다.
ex) data = [1, 2, "3", 4, [5, 6, "7"]]
print(data[0])
- 리스트 데이터 중 일부만 출력할 수 있다. (콜론(:)을 통해 시작과 끝을 정할 수 있다.)
ex) data = [1, 2, "3", 4, [5, 6, "7"]]
print(data[:3]) 또는 print(data[2:4])
data2 = "Hello World!!"
print(data2[4])
# (시작 번째:종료 번째 + 1) -> 2:3이라면, 3번째 항목인 "3"부터 4번째 항목인 4 이전인 "3"까지 이므로 "3"만 출력된다.
2. 튜플 자료형
- 괄호 안에 각 항목을 콤마로 구분하여 사용한다.
ex) data = (2, 3, 4)
- 항목의 값을 변경할 수 없다.
ex) data = (2, 3, 4, 5, 6, 7, 8, 9, (1, 2, 3))
data[0] = "1234" # 오류
del(data[0]) # 오류
- 변경되지 않아야 할 데이터 또는 변경하지 않을 데이터를 선언할 때 사용한다.
3. 딕셔너리 자료형
- 중괄호 안에 키와 값으로 선언하여 사용한다.
ex) data = {"key1": "value1", "key2": "value2",,,}
print(data["key1"])
- 기존에 생성된 값이 아니라면 생성된다.
ex) data = {"a": 1}
data["b"] = 2
print(data)
- Key를 숫자로 선언할 수 있지만 권장되지 않는다.
: 코드가 길어져서 선언부를 확인할 수 없다면 자료형을 확인하기 어렵다.