连接到 SuperAnnotate

SuperAnnotate 的 Python SDK 与 Azure Databricks 集成,提供一个一体化的 AI 数据基础结构平台,可帮助使用 Azure Databricks 的详尽数据管理、分布式计算和机器学习功能对高质量训练数据进行批注、调试、管理和版本化。

SuperAnnotate 连接器通过将批注数据转换为 Apache Spark 数据帧来简化此过程,使 ML 团队能够将注意力从数据整理转移到训练机器学习模型。 此协作能够设置主动学习工作流,其中低置信度预测会自动路由到 SuperAnnotate 平台。

要求

与 SuperAnnotate 集成之前,必须具备以下各项:

  • Azure Databricks 工作区中的 Databricks SQL 仓库

  • Azure Databricks 个人访问令牌

    注意

    作为安全最佳做法,在使用自动化工具、系统、脚本和应用进行身份验证时,Databricks 建议使用属于服务主体(而不是工作区用户)的个人访问令牌。 若要为服务主体创建令牌,请参阅管理服务主体的令牌

使用 Partner Connect 连接到 SuperAnnotate

注意

对于 SuperAnnotate,Partner Connect 仅支持 SQL 仓库。

要使用 Partner Connect 将 Azure Databricks 工作区连接到 SuperAnnotate,请执行以下操作:

  1. 在边栏中单击 Partner Connect 按钮“Partner Connect”。
  2. 单击合作伙伴磁贴。
  3. 检查提供的信息,然后单击“下一步”

你将重定向到 SuperAnnotate,在其中可以注册或登录(如果已有帐户)。

执行这些步骤后,将为你创建一个组织,以及名为“我的团队”的第一个团队。 你的组织还将自动拥有一个 Databricks 集成(值如步骤 3 中所提供),其在默认情况下将会添加到团队中。

后续步骤

通过 Partner Connect 设置组织和团队后,需要创建 LLM 和 GenAI 项目。 根据要导入的数据设置窗体,并添加具有 Databricks 集成的项

其他资源

浏览以下 SuperAnnotate 资源: