线上这个部署的demo，请问基本参数是怎么设置的（最佳的部署设置是？）

by chuangzhidian - opened Jul 11, 2024

Jul 11, 2024

因为好像demo比我本地部署的要好，测试多次，差别还挺大的，而且同样的输如，仅仅是形式不一样，不知道为什么结果也同样显著不一样。比如：
1.Query: "2022年7月到2023年7月之间发布的歌曲，按播放量取top 100，再按月粒度来统计近1年的运营播放量"\n\n"dbSchema": "Table: 歌曲库, Columns = ["歌曲语言", "歌曲来源", "运营播放量", "播放量", "歌曲名", "结算播放量", "专辑名", "发布日期", "歌曲版本", "歌曲类型", "数据日期"]"\n(补充信息:字段“数据日期”即当前的日期是2023-09-10)\n\nSQL:
2.Query: "2022年7月到2023年7月之间发布的歌曲，按播放量取top 100，再按月粒度来统计近1年的运营播放量"

"dbSchema": "Table: 歌曲库, Columns = ["歌曲语言", "歌曲来源", "运营播放量", "播放量", "歌曲名", "结算播放量", "专辑名", "发布日期", "歌曲版本", "歌曲类型", "数据日期"]"
(补充信息:字段“数据日期”即当前的日期是2023-09-10)

SQL:
2显著好于1，被惊讶到了

chuangzhidian

Jul 11, 2024

•

edited Jul 11, 2024

感觉训练时的prompt没有很复杂？一旦指令多后，输出就不行了，但少的时候，感觉又没有什么逻辑。比如加了一点无关的输入，应该不对对总体输出有影响，但就是输出差别比较大，显著不同了。

Stanislas

Z.ai org Jul 11, 2024

因为好像demo比我本地部署的要好，测试多次，差别还挺大的，而且同样的输如，仅仅是形式不一样，不知道为什么结果也同样显著不一样。比如：
1.Query: "2022年7月到2023年7月之间发布的歌曲，按播放量取top 100，再按月粒度来统计近1年的运营播放量"\n\n"dbSchema": "Table: 歌曲库, Columns = ["歌曲语言", "歌曲来源", "运营播放量", "播放量", "歌曲名", "结算播放量", "专辑名", "发布日期", "歌曲版本", "歌曲类型", "数据日期"]"\n(补充信息:字段“数据日期”即当前的日期是2023-09-10)\n\nSQL:
2.Query: "2022年7月到2023年7月之间发布的歌曲，按播放量取top 100，再按月粒度来统计近1年的运营播放量"

"dbSchema": "Table: 歌曲库, Columns = ["歌曲语言", "歌曲来源", "运营播放量", "播放量", "歌曲名", "结算播放量", "专辑名", "发布日期", "歌曲版本", "歌曲类型", "数据日期"]"
(补充信息:字段“数据日期”即当前的日期是2023-09-10)

SQL:
2显著好于1，被惊讶到了

SQL这类对于准确率较高的任务，建议使用更低随机性的设置。线上DEMO设置是temperature=0.2, top_p=0.95，也可以尝试设置更低的top_p。

chuangzhidian

Jul 12, 2024

好勒，谢谢。不太理解前面那个一样的输入，转义了而已，等同的，居然结果显著不一样

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment