A Contextual-Bandit Algorithm for Mobile Context-Aware Recommender System 논문 리뷰 Abastract 모바일 맥락 기반 추천 시스템의 대부분의 접근 방법은 맥락 정보를 활용해서 유저와 관련성 있는 아이템을 추천하는데 초점이 맞춰져 있다. 고려할만한 맥락 정보로 아래 세가지가 있다. 시간 위치 소셜 정보 이전의 연구들은 모두 유저의 컨 …
Collaborative Filtering Bandits 논문 리뷰 Collaborative Filtering Bandits 리뷰 ABSTRACT 기존 추천 방식 Collaborative filtering Content-Based Filtering 주어진 학습 데이터로 부터 모델을 학습하는 메소드( 정적인 모델 ). …
단단한 강화 학습 2장 다중 선택 2.6 ~ 정리 단단한 강화 학습 2장 다중 선택 2.6 ~ 정리 2.6 Optimal Initial Value Exploration을 촉진하는 기법을 긍정적 초깃값(Optimal initial value)라고 부른다. …
단단한 강화 학습 2장 다중 선택 ~ 2.5 정리 Bandit Problem은 오직 하나의 상태만 다루는 강화학습 문제이다. 강화 학습은 지도 학습과는 다른 종류의 학습 피드백을 전달한다. 학습자의 행동과 무관하게 정해져 있는 정답이 있는 지도 학습과는 다르게, 강화 학습은 행동에 대한 결과를 피드백 …
Cross-lingual Language Model Pretraining : XLM 리뷰 Abstract 최근 연구들은 영어 자연어 이해를 위한 생성적 사전학습(generative pretraining)의 효율성을 증명했다. 본 연구에서는 이 방식을 여러 언어들로 확장해서 교차 언어(cross-lingual) 사전학습의 효과를 보인다. …