Distilling Task-Specific Knowledge from BERT into Simple Neural Networks 리뷰 Distilling Task-Specific Knowledge from BERT into Simple Neural Networks Abstract 자연어 처리 분야에서 뉴럴 네트워크는 깊어지고 복잡해지고 있다. …