- 赛题名称:Google – AI Assistants for Data Tasks with Gemma
- 赛题任务:利用gemma构建有效工具
- 赛题类型:NLP大模型
- 赛题链接:
赛题背景
谷歌推出了 Gemma,这是一系列新的开放式LLM(大型语言模型),采用了与创建他们的 Gemini 模型相同的研究和技术。在这个竞赛中,你将面临一个挑战,即展示如何使用 Gemma 来完成一个或多个数据科学相关的任务。
Gemma 是一个轻量级、先进的开放模型系列,采用与创建 Gemini 模型相同的研究和技术构建而成。Gemma 模型有多种规模,因此您可以基于可用的计算资源、所需功能以及运行位置来构建生成式 AI 解决方案。如果您不确定从何处开始,不妨尝试使用 2B 参数大小,以降低资源要求并在部署模型时更加灵活。
参数大小 | 输入 | 输出 | 调整后的版本 | 目标平台 |
---|---|---|---|---|
2B | 文字 | 文字 | 预先训练指令已调整 | 移动设备和笔记本电脑 |
70 亿 | 文字 | 文字 | 预先训练指令已调整 | 桌面设备和小型服务器 |
赛题任务
本次竞赛的目标是创建一个Notebook,展示如何使用 Gemma LLM(大型语言模型)来完成以下数据科学相关任务之一:
- 解释或教授基本的数据科学概念。
- 回答关于 Python 编程语言的常见问题。
- 总结 Kaggle 解决方案写作。
- 解释或教授来自 Kaggle 竞赛解决方案写作的概念。
- 回答关于 Kaggle 平台的常见问题。
评价指标
资格标准
**符合性:**提交内容符合指南和说明。 | [是/否] |
---|---|
**主题相关性:**提交内容与5个主题之一相关。 | [是/否] |
**开放性:**笔记本和所有基础数据源已公开。 | [是/否] |
评估标准
**技术性:**方法有效地利用了少样本提示、检索增强生成和/或微调等策略。 | [0-10分] |
---|---|
**描述性:**代码有良好的文档说明,包括解释代码和提供背景的 Markdown 单元格。 | [0-10分] |
**实用性:**方法产生的输出是有用的或高质量的。 | [0-10分] |
**健壮性:**在使用额外输入进行测试时,方法运行良好。 | [0-10分] |
提交方法
要参加此次比赛,您必须创建并共享一个公开的 Kaggle 笔记本,展示如何使用 Gemma 模型来完成5个相关任务中的一个。
您的 Kaggle 笔记本必须公开(以及任何基础数据源),并且必须附加到官方竞赛数据集上。所有团队成员必须列为笔记本的协作者,并且笔记本必须通过 Google 表单提交。
赛题时间轴
- 2024年2月21日:开始日期
- 2024年4月14日:参赛截止日期
- 2024年4月14日:团队合并截止日期
- 2024年4月14日:最终提交截止日期