Table.AddFuzzyClusterColumn
Syntaksi
Table.AddFuzzyClusterColumn(table as table, columnName as text, newColumnName as text, optional options as nullable record) as table
Tietoja
Lisää uuden sarakkeen newColumnName
, table
jonka edustavat arvot columnName
ovat . Edustajat saadaan täsmäyttämällä sumeasti arvot kohdassa columnName
kullekin riville.
Valinnainen - options
joukko voidaan sisällyttää määrittämään, miten avainsarakkeita verrataan. Vaihtoehtoja ovat:
Culture
: Mahdollistaa tietueiden ryhmittelyn maa-asetuskohtaisten sääntöjen perusteella. Se voi olla mikä tahansa kelvollinen maa-asetuksen nimi. Esimerkiksi maa-asetus ja-JP tekee tietueiden ryhmittelemisen japanin kieliasetuksen perusteella. Oletusarvo on "", joka ryhmittelee muuttumattoman englannin maa-asetuksen perusteella.IgnoreCase
: Looginen arvo (tosi/epätosi), joka sallii kirjainkooltaan riippumattoman avainryhmityksen. Esimerkiksi kun arvo on tosi, Viinirypäleet ryhmitetään arvon "viinirypäleet" kanssa. Oletusarvo on tosi.IgnoreSpace
: Looginen arvo (tosi/epätosi), joka sallii tekstiosien yhdistämisen ryhmien löytämiseksi. Esimerkiksi kun arvo on tosi, "Viinirypäleet" ryhmitettää arvon "Viinirypäleet" kanssa. Oletusarvo on tosi.SimilarityColumnName
: Sarakkeen nimi, joka näyttää syötteen arvon ja kyseisen syötteen edustavan arvon samankaltaisuuden. Oletusarvo on tyhjäarvo, jolloin uutta saraketta samankaltaisuuksille ei lisätä.Threshold
: Luku väliltä 0,00–1,00, joka määrittää samankaltaisuuspistemäärän, jolla kaksi arvoa ryhmitellään. Esimerkiksi Rypäleet ja Ryäleet (p puuttuu) ryhmitetään yhteen vain, jos tämän asetuksen arvo on pienempi kuin 0,90. Raja-arvo 1,00 sallii vain tarkat vastaavuudet. (Huomaa, että sumea "tarkka vastaavuus" saattaa ohittaa erot, kuten johdannaisen, sanajärjestyksen ja välimerkit.) Oletusarvo on 0,80.TransformationTable
: Taulukko, joka sallii tietueiden ryhmittelyn mukautettujen arvojen yhdistämismääritysten perusteella. Sen tulee sisältää sarakkeet From ja To. Esimerkiksi Rypäleet ryhmitelee arvon "Rusinat", jos annetaan muunnostaulukko, jossa on From-sarakkeessa Rypäleet ja To-sarakkeessa Rusinat. Ota huomioon, että muunnoksia käytetään tekstin kaikissa esiintymiskertoissa muunnostaulukossa. Yllä olevassa muunnostaulukossa "Rypäleet ovat makeita" ryhmitetään myös "Rusinat ovat makeita".
Esimerkki 1
Selvitä työntekijöiden arvot työntekijöiden sijaintia varten.
Käyttö
Table.AddFuzzyClusterColumn(
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle"],
[EmployeeID = 2, Location = "seattl"],
[EmployeeID = 3, Location = "Vancouver"],
[EmployeeID = 4, Location = "Seatle"],
[EmployeeID = 5, Location = "vancover"],
[EmployeeID = 6, Location = "Seattle"],
[EmployeeID = 7, Location = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text]
),
"Location",
"Location_Cleaned",
[IgnoreCase = true, IgnoreSpace = true]
)
Tuloste
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
[EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
[EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
[EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
[EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)
Palaute
https://aka.ms/ContentUserFeedback.
Tulossa pian: Vuoden 2024 aikana poistamme asteittain GitHub Issuesin käytöstä sisällön palautemekanismina ja korvaamme sen uudella palautejärjestelmällä. Lisätietoja on täällä:Lähetä ja näytä palaute kohteelle