Table.FuzzyGroup
Table.FuzzyGroup(table as table, key as any, aggregatedColumns as list, optional options as nullable record) as table
Ryhmittelee table
rivit täsmäämällä jokaisen rivin määritetyn sarakkeen key
arvot sumeasti. Kullekin ryhmälle muodostetaan tietue, joka sisältää avainsarakkeet (ja niiden arvot) sekä aggregatedColumns
määrittämät mahdolliset koostesarakkeet. Tämä funktio ei voi taata kiinteän rivien järjestyksen palauttamista.
Valinnainen joukko options
voidaan sisällyttää määrittämään, miten avainsarakkeita verrataan. Vaihtoehtoja ovat seuraavat:
-
Culture
: Mahdollistaa tietueiden ryhmittelyn maa-asetuskohtaisten sääntöjen perusteella. Se voi olla mikä tahansa kelvollinen maa-asetuksen nimi. Esimerkiksi Maa-asetusja-JPryhmittelee tietueet japanin maa-asetuksen perusteella. Oletusarvo on "", joka ryhmittelee muuttumattoman englannin maa-asetuksen perusteella. -
IgnoreCase
: Looginen arvo (tosi/epätosi), joka sallii kirjainkooltaan riippumattoman avainryhmittämisen. Esimerkiksi kun arvo on tosi, Viinirypäleet ryhmitetään arvon "viinirypäleet" kanssa. Oletusarvo on true. -
IgnoreSpace
: Looginen arvo (true/false), joka sallii tekstiosien yhdistämisen ryhmien löytämiseksi. Esimerkiksi kun arvo on tosi, "Viinirypäleet" ryhmitettää arvon "Viinirypäleet" kanssa. Oletusarvo on true. -
SimilarityColumnName
: Sarakkeen nimi, joka näyttää syötteen arvon ja kyseisen syötteen edustavan arvon samankaltaisuuden. Oletusarvo on tyhjäarvo, jolloin uutta saraketta samankaltaisuuksille ei lisätä. -
Threshold
: Luku väliltä 0,00–1,00, joka määrittää samankaltaisuuspistemäärän, jolla kaksi arvoa ryhmitellään. Esimerkiksi Rypäleet ja Ryäleet (p puuttuu) ryhmitetään yhteen vain, jos tämän asetuksen arvo on pienempi kuin 0,90. Raja-arvo 1,00 sallii vain tarkat vastaavuudet. (Huomaa, että sumea "tarkka vastaavuus" saattaa ohittaa erot, kuten johdannaisen, sanajärjestyksen ja välimerkit.) Oletusarvo on 0,80. -
TransformationTable
: Taulukko, joka sallii tietueiden ryhmittelyn mukautettujen arvoyhteyksien perusteella. Sen tulee sisältää sarakkeet From ja To. Esimerkiksi Rypäleet ryhmitelee arvon "Rusinat", jos annetaan muunnostaulukko, jossa on From-sarakkeessa Rypäleet ja To-sarakkeessa Rusinat. Ota huomioon, että muunnoksia käytetään tekstin kaikissa esiintymiskertoissa muunnostaulukossa. Yllä olevassa muunnostaulukossa "Rypäleet ovat makeita" ryhmitetään myös "Rusinat ovat makeita".
Ryhmittele taulukko lisäämällä koostesarake [Count], joka sisältää työntekijöiden määrän kussakin sijainnissa (each Table.RowCount(_)
).
käyttö
Table.FuzzyGroup(
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle"],
[EmployeeID = 2, Location = "seattl"],
[EmployeeID = 3, Location = "Vancouver"],
[EmployeeID = 4, Location = "Seatle"],
[EmployeeID = 5, Location = "vancover"],
[EmployeeID = 6, Location = "Seattle"],
[EmployeeID = 7, Location = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text]
),
"Location",
{"Count", each Table.RowCount(_)},
[IgnoreCase = true, IgnoreSpace = true]
)
Output
Table.FromRecords({
[Location = "Seattle", Count = 4],
[Location = "Vancouver", Count = 3]
})