목록AI (114)
기록하는삶
지난 글: https://mingchin.tistory.com/478 [음성 인식/STT] 음성 신호의 변환(sampling, quantization, coding) 소리와 소리의 표현, waveform 소리의 본질은 공기의 진동이다. 인간의 귀(고막)은 공기 분자의 움직임을 감지해 이를 소리로 인식하며, 해당 진동이 '얼마나 빠르게', '얼마나 크게' 일어나느냐에 mingchin.tistory.com 지난 글에서 음성 신호는 본래 연속적이지만 이를 digital 신호로 변환하는 sapming, quantization, coding 등의 과정을 거쳐 discrete한 값으로 변환한다는 것을 알아보았다. 이번 글에서는 그렇게 변환된 음성으로부터 특징(features)을 추출하는 과정을 정리해본다. Wind..
소리와 소리의 표현, waveform 소리의 본질은 공기의 진동이다. 인간의 귀(고막)은 공기 분자의 움직임을 감지해 이를 소리로 인식하며, 해당 진동이 '얼마나 빠르게', '얼마나 크게' 일어나느냐에 따라 다른 소리로 인식하게 된다. 이러한 공기 분자의 움직임을 표현하는 방법 중 하나가 waveform이며, x축에 time y축의 amplitude를 표현해 시간에 따른 공기 분자의 움직임의 폭을 나타낸다. waveform의 각 점은 일렬의 공기 분자의 움직임을 대표하는 값이라고 볼 수 있다. 이러한 움직임은 주기성을 가지고 나타나며 진동수(frequency), 진폭(amplitude)에 따라 소리의 특성(크기, 높낮이 등)이 달라지게 된다. STT(Speech to Text)은 waveform의 형태로..
Shell 운영체제에서 커널과 유저 사이에서 유저의 명령을 해석하고 그 처리 결과를 나타내는 프로그램. 내부의 커널이 있고 사용자는 이를 감싸고 있는 껍데기를 통해 커널에 접근한다는 의미. Bourne Again Shell, bash 리눅스 계열에서 기본 셸로 활용되는 C 기반 셸로, Bourne shell(sh)를 대체하기 위해 만들어졌다. 외에도 zshell(zsh), Korn shell(ksh), C shell(csh) 등 다양한 종류가 있다. bash에 로그인 시 1) /etc/profile & /etc/profile.d/*.sh 실행 2) ~/.bash_profile 실행 ~/.bash_profile ~/.bashrc 실행 & PATH 변수 설정 및 export(= 지역변수의 전역변수화) → 로..
Redhat/CenOS 기반업데이트 중 목차: 클릭하면 이동 1. 도움말 2. 가상환경 3. 패키지관리 4. 백그라운드 실행 5. 음성 변환 6. 파일 다루기 7. 권한 8. 명령어 [도움말/편의성] (돌아가기) # 도움말명령어 --help : 명령어 사용법man 명령어 : 명령어 사용법# 모든 명령어에 자주 사용되는 옵션-r: recursive-a: all-i: interactive-f: force############################################################# 이전에 사용했던 명렁어 목록history n: 최근에 사용한 n개 명령어history -c: 히스토리 목록 클리어!num: history에 저장된 num번 명령 재실행!!: 바로 직전에 사용..
import warnings warnings.filterwarnings('ignore')
https://fastapi.tiangolo.com/ko/ FastAPI FastAPI FastAPI 프레임워크, 고성능, 간편한 학습, 빠른 코드 작성, 준비된 프로덕션 문서: https://fastapi.tiangolo.com 소스 코드: https://github.com/tiangolo/fastapi FastAPI는 현대적이고, 빠르며(고성능), 파이썬 fastapi.tiangolo.com FastAPI는 2019년 공개된 Python Web Framework 중 하나로, Flask와 Django를 뒤이어 떠오르는 웹 개발 도구다. Flask와 Django 대비 우수한 성능과 쉬운 문법, 그리고 Swagger라 불리는 기능을 활용한 자동 documentation, Pydantic을 이용한 Seria..
지금까지 알고 있었던 패키지 관리 도구는 pip와 이를 활용한 requirement.txt 정도가 있었고, 가상 환경의 경우 anaconda를 활용하고 virtualenv 라는 게 있다더라, 정도를 알고 있는게 전부였다. 가상환경의 경우 문제가 생기면 폐기하고 새로 만들면 그만이었지만 pip를 활용해 여러 패키지를 설치하는 경우에는 버전 충돌이 종종 생기기도 하였고, 이를 해결하기 위해 시간을 버리는 경우도 많았다. 이러한 문제들을 방지하고 보다 효율적으로 가상환경 및 패키지 관리가 가능한 도구가 poetry라고 한다. [설치 - 공식 홈페이지] https://python-poetry.org/docs/#windows-powershell-install-instructions Introduction | Do..
https://github.com/RUCAIBox/RecBole GitHub - RUCAIBox/RecBole: A unified, comprehensive and efficient recommendation library A unified, comprehensive and efficient recommendation library - GitHub - RUCAIBox/RecBole: A unified, comprehensive and efficient recommendation library github.com RecBole은 파이토치/파이썬 기반으로 만들어진 라이브러리로 글을 쓰는 시점을 기준으로 78개의 추천 시스템 관련 알고리즘 모델이 구현돼 있다. 라이브러리가 요구하는 형식에 맞춰 데이터와 con..
1) tensor의 data type tensor에는 위와 같이 다양한 자료형이 있다.(사진은 왜 잘려있을까?) 자료형마다 필요로하는 메모리가 달라지기 때문에 최적화와 관련 있을 듯 한데, double, half, short, long 등의 이름을 기억해두어야 잘 활용할 수 있다. 2) Transformer의 decoder와 SASRec 여기서 자세히 정리하지는 않겠지만, Self-Attention mechanism은 주변 정보와의 attention을 학습하여 sequential한 예측을 하기 때문에, 예측에 관여하는 decoder의 경우 미래 정보를 사용하지 않도록 masking을 해주는 과정이 필요하다. 의미 없는 숫자 혹은 mask 토큰 등으로 미래 정보를 가려놓는다고 생각하면 된다. 여기서 정리해..
fig = plt.figure(figsize=(9, 9)) ax = fig.add_subplot(111, aspect=1) i = 13 ax.scatter(x=student['math score'], y=student['reading score'], c='lightgray', alpha=0.9, zorder=5) ax.scatter(x=student['math score'][i], y=student['reading score'][i], c='tomato', alpha=1, zorder=10) ax.set_xlim(-3, 102) ax.set_ylim(-3, 102) ax.spines['top'].set_visible(False) ax.spines['right'].set_visible(False) ax.s..