Data Analysis

Python/Numpy 3

[Python] Numpy (3) Boolean, Fancy Indexing

Boolean Indexing 중복된 이름을 포함한 배열. randn 함수를 이용하여 표준 정규분포 데이터 생성 names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe']) data = np.random.randn(7, 4) # 7x4 array names data names 와 'Bob'문자열 비교하면 불리언 배열 반환 names == 'Bob' # 이 불리언 배열을 배열의 색인으로 사용 가능 data[names == 'Bob'] # 'Bob'이 있는 index 0 과 index 3 에 해당하는 데이터 # *불리언 배열은 반드시 색인하려는 축의 길이와 동일한 길이를 가져야 함. # 하지만 동일한 길이가 아니더라도 error 는 발생하지 않..

Python/Numpy 2022.11.25

[Python] Numpy (2) 배열 생성, 자료형

배열 생성 함수 array: 입력 데이터(리스트, 튜플, 배열 또는 다른 순차형 데이터)를 ndarray 로 변환하며 dtype 을 명시하지 않은 경우 자료형을 추론하여 저장 asarray: 입력 데이터를 ndarray 로 변환하지만 입력 데이터가 이미 ndarray 일 경우 복사가 일어나지 않는다. arange: 내장 range 함수와 유사. 리스트 대신 ndarray 반환 ones, ones_like: 주어진 dtype 과 모양을 가지는 배열을 생성하고 내용을 모두 1 로 초기화. ones_like 는 주어진 배열과 동일한 모양과 dtype 을 가지는 배열을 새로 생성하여 내용을 모두 1 로 초기화 zeros, zeros_like: 내용을 모두 0 으로 배열 empty, empty_like: 메모리를..

Python/Numpy 2022.11.25

[Python] Numpy (1)

Numpy : Numerical Python Numpy 호율적인 다차원 배열인 ndarray 는 빠른 배열 계산과 유연한 브로드캐스팅 기능을 제공한다. 반복문을 작성할 필요 없이 전체 데이터 배열을 빠르게 계산할 수 있는 표준 수학함수이다. 배열 데이터를 디스크에 쓰거나 읽을 수 있는 도구와 메모리에 적재된 파일을 다루는 도구이다 Numpy 자체는 모델링이나 과학 계산을 위한 기능을 제공하는 않는다.. Numpy 배열과 배열 기반 연산에 대한 이해 후 pandas 같은 배열 기반 도구 사용 시 더 효율적이다. pandas 는 Numpy 에는 없는 시계열 처리 같은 다양한 도메인 특화기능 제공한다 Numpy 는 내부적으로 데이터를 다른 내장 파이썬 객체와 구분된 연속된 메모리 블록에 저장한다. 각종 알고리..

Python/Numpy 2022.11.25