Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
İşlev, ai.extract giriş metnini taramak ve seçtiğiniz etiketler (örneğin, konumlar veya adlar) tarafından belirlenen belirli bilgi türlerini ayıklamak için üretken yapay zeka kullanır. Yalnızca tek bir kod satırı kullanır.
Uyarı
- Bu makalede pandas ile ai.extract kullanımı yer alır. PySpark ile ai.extract kullanmak için bu makaleye bakın.
- Bu genel bakış makalesinde diğer yapay zeka işlevlerine bakın.
- Yapay zeka işlevlerinin yapılandırmasını özelleştirmeyi öğrenin.
Genel Bakış
ai.extract işlevi, pandas Series sınıfını genişletir. Her giriş satırından özel varlık türlerini ayıklamak için pandas DataFrame metin sütununda işlevini çağırın.
Diğer yapay zeka işlevlerinden farklı olarak ai.extract, her giriş satırı için ayıklanan değerleri içeren belirtilen her varlık türü için ayrı bir sütuna sahip bir Seri yerine pandas DataFrame döndürür.
Sözdizimi
df_entities = df["text"].ai.extract("entity1", "entity2", "entity3")
Parametreler
| İsim | Description |
|---|---|
labels Gerekli |
Giriş metni değerlerinden ayıklanması gereken varlık türleri kümesini temsil eden bir veya daha fazla dize . |
aifunc.ExtractLabel Opsiyonel |
Ayıklanması gereken alanların tanımını içeren bir veya daha fazla etiket tanımı. Daha fazla bilgi için ExtractLabel Parametreleri tablosuna bakın. |
ExtractLabel Parametreleri
| İsim | Description |
|---|---|
label Gerekli |
Giriş metni değerlerinden ayıklanan varlığı temsil eden bir dize . |
description Opsiyonel |
Yapay zeka modeli için ek bağlam ekleyen bir dize . Yapay zekanın ayıklama sırasında dikkate alması gereken bağlamı, gereksinimleri veya yönergeleri içerebilir. |
max_items Opsiyonel |
Bu etiket için ayıklanması gereken en fazla öğe sayısını belirten bir int . |
type Opsiyonel |
Ayıklanan değer için JSON şema türü. Bu sınıf için desteklenen türler : string, number, integer, boolean, objectve array. |
properties Opsiyonel |
Sözlük olarak türü için daha fazla JSON şema özelliği. Diziler için "öğeler", nesneler için "özellikler", sabit listesi türleri için "numaralandırma" ve daha fazlası gibi desteklenen özellikleri içerebilir. Bu makaledeki örnek kullanıma bakın. |
raw_col Opsiyonel |
Ham LLM yanıtı için sütun adını ayarlayan dize . Ham yanıt, "reason" ve "extraction_text" dahil olmak üzere her varlık etiketi için sözlük çiftlerinin listesini sağlar. |
İade
İşlev, belirtilen her varlık türü için bir sütuna sahip pandas DataFrame döndürür. Sütun veya sütunlar, giriş metninin her satırı için ayıklanan varlıkları içerir. İşlev bir varlık için birden fazla eşleşme tanımlarsa, bu eşleşmelerden yalnızca birini döndürür. Eşleşme bulunmazsa, sonuç nullolur.
Varsayılan dönüş türü, her etiket için bir dize listesidir. Kullanıcılar yapılandırmada aifunc.ExtractLabel "type=integer" gibi farklı bir tür belirtmeyi seçerse, çıkış python int listesi olur. Kullanıcılar yapılandırmada aifunc.ExtractLabel "max_items=1" belirtirse, bu etiket için türün yalnızca bir öğesi döndürülür.
Example
# This code uses AI. Always review output for mistakes.
df = pd.DataFrame([
"MJ Lee lives in Tuscon, AZ, and works as a software engineer for Contoso.",
"Kris Turner, a nurse at NYU Langone, is a resident of Jersey City, New Jersey."
], columns=["descriptions"])
df_entities = df["descriptions"].ai.extract("name", "profession", "city")
display(df_entities)
Bu örnek kod hücresi aşağıdaki çıkışı sağlar:
İlgili içerik
PySpark ile ai.extract kullanın.
ai.analyze_sentiment ile duygu tespiti yapın.
ai.embed ile vektör eklemeleri oluşturun.
dil bilgisini ai.fix_grammar ile düzeltin.
ai.generate_response ile özel kullanıcı istemlerini yanıtlayın.
ai.similarity ile benzerliği hesaplayın.
Metni ai.summarize ile özetleme.
Yapay zeka işlevlerinin tamamı hakkında daha fazla bilgi edinin.
Yapay zeka işlevlerinin yapılandırmasını özelleştirin.
İhtiyacınız olan bir özelliği kaçırdık mı? Fabric Fikirleri forumu'nda önerin.