파이썬 핵심 문법 정리

2025. 9. 18. 20:14개발/텍스트마이닝과 언어모델

반응형

 

1. 파이썬의 특징

  • 인터프리터 언어: 컴파일 없이 실행.
  • 동적 타이핑: 변수 자료형 자동 결정.
  • 들여쓰기 기반 문법: 블록 구분.
  • main 함수 강제 없음: if __name__ == "__main__": 관례 사용.
  • 세미콜론 불필요, 다중 할당, 값 교환 가능.
  • Colab/Jupyter에서 셀 단위 실행 및 런타임 리셋으로 메모리 초기화.

2. 변수와 자료형

  • 모든 값은 객체(Object), 변수는 참조 역할.
  • 기본 자료형: int, float, str, bool.
  • 컨테이너 자료형:
    • list: 가변, 인덱스로 접근, append, del, sort, slicing.
    • tuple: 불변, 읽기 전용, 메모리 효율적.
    • dict: {key: value} 구조, 키로 접근.
    • set: 중복 없는 집합, 순서 없음, 중복 제거에 효과적.
  • 사용자 정의 자료형: class로 생성.

3. 제어 구조

  • 조건문: if, elif, else.
  • 논리 연산자: and, or, not.
  • 반복문:
    • for: iterable 순회 (range, list, dict 등).
    • while: 조건 기반 반복.
  • 반복 제어: break, continue.
  • 유용한 함수: enumerate, zip.
  • 컴프리헨션:
    • 리스트 [x**2 for x in nums if 조건]
    • 딕셔너리 {k: v for k, v in ...}

4. 함수

  • def로 정의, return으로 값 반환.
  • 매개변수:
    • 위치 인자, 키워드 인자.
    • *args: 튜플로 가변 인자.
    • **kwargs: 딕셔너리로 가변 인자.
  • 함수 활용: 데이터 가공, 조건 검증 → 리스트 컴프리헨션과 결합 가능.

5. 파일 입출력

  • 텍스트 파일:
    • with open(filename, mode) → 자동 close.
    • read, readlines, write.
  • CSV 파일:
    • csv.reader: 각 행을 리스트로 읽음.
    • csv.writer: 행 단위 쓰기.
    • 대용량 처리 시 스트리밍 가능 (메모리 절약).
  • 실습 예제: Titanic 데이터 → 생존자·사망자 수, 티켓 등급별 통계.

👉 핵심은 파이썬의 기본 문법(자료형, 제어 구조, 함수, 파일 처리)을 빠르게 복습하고, 텍스트마이닝 실습에 바로 활용할 수 있도록 하는 것.

반응형