Kaggle赛题解析:Gemma AI助手

  • 赛题名称:Google – AI Assistants for Data Tasks with Gemma
  • 赛题任务:利用gemma构建有效工具
  • 赛题类型:NLP大模型
  • 赛题链接:point_down:

Google – AI Assistants for Data Tasks with Gemma | Kaggle

赛题背景

谷歌推出了 Gemma,这是一系列新的开放式LLM(大型语言模型),采用了与创建他们的 Gemini 模型相同的研究和技术。在这个竞赛中,你将面临一个挑战,即展示如何使用 Gemma 来完成一个或多个数据科学相关的任务。

Gemma 是一个轻量级、先进的开放模型系列,采用与创建 Gemini 模型相同的研究和技术构建而成。Gemma 模型有多种规模,因此您可以基于可用的计算资源、所需功能以及运行位置来构建生成式 AI 解决方案。如果您不确定从何处开始,不妨尝试使用 2B 参数大小,以降低资源要求并在部署模型时更加灵活。

参数大小 输入 输出 调整后的版本 目标平台
2B 文字 文字 预先训练指令已调整 移动设备和笔记本电脑
70 亿 文字 文字 预先训练指令已调整 桌面设备和小型服务器

赛题任务

本次竞赛的目标是创建一个Notebook,展示如何使用 Gemma LLM(大型语言模型)来完成以下数据科学相关任务之一:

  1. 解释或教授基本的数据科学概念。
  2. 回答关于 Python 编程语言的常见问题。
  3. 总结 Kaggle 解决方案写作。
  4. 解释或教授来自 Kaggle 竞赛解决方案写作的概念。
  5. 回答关于 Kaggle 平台的常见问题。

评价指标

资格标准

**符合性:**提交内容符合指南和说明。 [是/否]
**主题相关性:**提交内容与5个主题之一相关。 [是/否]
**开放性:**笔记本和所有基础数据源已公开。 [是/否]

评估标准

**技术性:**方法有效地利用了少样本提示、检索增强生成和/或微调等策略。 [0-10分]
**描述性:**代码有良好的文档说明,包括解释代码和提供背景的 Markdown 单元格。 [0-10分]
**实用性:**方法产生的输出是有用的或高质量的。 [0-10分]
**健壮性:**在使用额外输入进行测试时,方法运行良好。 [0-10分]

提交方法

要参加此次比赛,您必须创建并共享一个公开的 Kaggle 笔记本,展示如何使用 Gemma 模型来完成5个相关任务中的一个。

您的 Kaggle 笔记本必须公开(以及任何基础数据源),并且必须附加到官方竞赛数据集上。所有团队成员必须列为笔记本的协作者,并且笔记本必须通过 Google 表单提交。

赛题时间轴

  • 2024年2月21日:开始日期
  • 2024年4月14日:参赛截止日期
  • 2024年4月14日:团队合并截止日期
  • 2024年4月14日:最终提交截止日期