Поделиться через


Использование ai.embed с pandas

Функция ai.embed использует генерированный ИИ для преобразования текста в векторные внедрения. Эти векторы позволяют ИИ понимать связи между текстами, чтобы можно было искать, группировать и сравнивать содержимое на основе смысла, а не точного формулировки. С помощью одной строки кода можно создавать векторные представления из столбца в DataFrame.

Замечание

Обзор

Функция ai.embed расширяет класс серии pandas.

Чтобы создать векторные представления каждой входной строки, вызовите функцию на объекте pandas Series или на текстовом столбце pandas DataFrame.

Функция возвращает ряд pandas, содержащий внедренные элементы, которые могут храниться в новом столбце DataFrame.

Синтаксис

df["embed"] = df["col1"].ai.embed()

Параметры

Нет.

Возвраты

Функция возвращает Series pandas, содержащий векторные вложения в виде numpy массива float-32 для каждой входной строке текста. Количество элементов в массиве зависит от измерений модели внедрения, которые можно настроить в функциях ИИ.

Example

# This code uses AI. Always review output for mistakes.

df = pd.DataFrame([
        "This duvet, lovingly hand-crafted from all-natural fabric, is perfect for a good night's sleep.",
        "Tired of friends judging your baking? With these handy-dandy measuring cups, you'll create culinary delights.",
        "Enjoy this *BRAND NEW CAR!* A compact SUV perfect for the professional commuter!"
    ], columns=["descriptions"])
    
df["embed"] = df["descriptions"].ai.embed()
display(df)

В этом примере ячейка кода предоставляет следующие выходные данные:

Снимок экрана: кадр данных с столбцами