https://arca.live/b/alpaca/118261066?p=2 의 방법을 활용하여 만들어졌음.
를 적당히 샘플링하여 만들었음.
LogicKor 점수는 가장 높음.
해당 모델은 DPO 학습되지 않았음.
Chat template
Files info
Base model