목록Data Science (8)
내가 보려고 만든 블로그

class model(nn.module): def __init__(self): pass def forward(sefl): pass Torch로 모델을 만들다 보면 항상 궁금한 것이 있었다. 보통 토치에서 모델을 만들때 다음과 같은 형태로 모델을 만드는데 이렇게 만들어진 클래스를 model = model() 과 같이 인스턴스한 한 후 input을 넣기만 하면 모델이 동작을 한다는 점이다. 분명히 forward부분을 정의만하고 사용한 적이 없는데도 말이다. 궁금해서 module.nn의 소스코드를 열어보았다. https://github.com/pytorch/pytorch/blob/master/torch/nn/modules/module.py GitHub - pytorch/pytorch: Tensors and D..

Topic 모델링이란 어떠한 문서를 주제의 확률 분포로 표현하는 것이다. 예컨대 신문의 기사들이 경제 ,스포츠 , 연예 3가지 주제만을 가진다고 해보자. 경제 뉴스에는 당연히 경제와 관련된 단어들이 많이 분포할 것이다. 하지만 그렇다고 해서 경제에서 사용되는 단어뿐만이 아니라 스포츠 , 연예 등에서 사용하는 단어들이 존재 할 수있다. 이렇게 한 문서 안에서 단어들의 주제를 파악하고 그 단어들의 분포를 통해 한 문서를 주제의 분포로 나타낼 수 있다. LDA 를 검색하면 가장 많이 나오는 그림이 바로 위와 같은 그림일 것이다. 오른쪽 부터 , 베타는 주제 X 문서의 Dirichlet 분포를 결정하는 Hyperparameter ,피(k) 는 주제X문서의 분포이며 K는 주제들의 집합이다. 알파는 단어X 문서의 ..