Jaa


Table.AddFuzzyClusterColumn

Syntaksi

Table.AddFuzzyClusterColumn(table as table, columnName as text, newColumnName as text, optional options as nullable record) as table

Tietoja

Lisää uuden sarakkeen newColumnName , table jonka edustavat arvot columnNameovat . Edustajat saadaan täsmäyttämällä sumeasti arvot kohdassa columnNamekullekin riville.

Valinnainen - options joukko voidaan sisällyttää määrittämään, miten avainsarakkeita verrataan. Vaihtoehtoja ovat:

  • Culture: Mahdollistaa tietueiden ryhmittelyn maa-asetuskohtaisten sääntöjen perusteella. Se voi olla mikä tahansa kelvollinen maa-asetuksen nimi. Esimerkiksi maa-asetus ja-JP tekee tietueiden ryhmittelemisen japanin kieliasetuksen perusteella. Oletusarvo on "", joka ryhmittelee muuttumattoman englannin maa-asetuksen perusteella.
  • IgnoreCase: Looginen arvo (tosi/epätosi), joka sallii kirjainkooltaan riippumattoman avainryhmityksen. Esimerkiksi kun arvo on tosi, Viinirypäleet ryhmitetään arvon "viinirypäleet" kanssa. Oletusarvo on tosi.
  • IgnoreSpace: Looginen arvo (tosi/epätosi), joka sallii tekstiosien yhdistämisen ryhmien löytämiseksi. Esimerkiksi kun arvo on tosi, "Viinirypäleet" ryhmitettää arvon "Viinirypäleet" kanssa. Oletusarvo on tosi.
  • SimilarityColumnName: Sarakkeen nimi, joka näyttää syötteen arvon ja kyseisen syötteen edustavan arvon samankaltaisuuden. Oletusarvo on tyhjäarvo, jolloin uutta saraketta samankaltaisuuksille ei lisätä.
  • Threshold: Luku väliltä 0,00–1,00, joka määrittää samankaltaisuuspistemäärän, jolla kaksi arvoa ryhmitellään. Esimerkiksi Rypäleet ja Ryäleet (p puuttuu) ryhmitetään yhteen vain, jos tämän asetuksen arvo on pienempi kuin 0,90. Raja-arvo 1,00 sallii vain tarkat vastaavuudet. (Huomaa, että sumea "tarkka vastaavuus" saattaa ohittaa erot, kuten johdannaisen, sanajärjestyksen ja välimerkit.) Oletusarvo on 0,80.
  • TransformationTable: Taulukko, joka sallii tietueiden ryhmittelyn mukautettujen arvojen yhdistämismääritysten perusteella. Sen tulee sisältää sarakkeet From ja To. Esimerkiksi Rypäleet ryhmitelee arvon "Rusinat", jos annetaan muunnostaulukko, jossa on From-sarakkeessa Rypäleet ja To-sarakkeessa Rusinat. Ota huomioon, että muunnoksia käytetään tekstin kaikissa esiintymiskertoissa muunnostaulukossa. Yllä olevassa muunnostaulukossa "Rypäleet ovat makeita" ryhmitetään myös "Rusinat ovat makeita".

Esimerkki 1

Selvitä työntekijöiden arvot työntekijöiden sijaintia varten.

Käyttö

Table.AddFuzzyClusterColumn(
    Table.FromRecords(
        {
            [EmployeeID = 1, Location = "Seattle"],
            [EmployeeID = 2, Location = "seattl"],
            [EmployeeID = 3, Location = "Vancouver"],
            [EmployeeID = 4, Location = "Seatle"],
            [EmployeeID = 5, Location = "vancover"],
            [EmployeeID = 6, Location = "Seattle"],
            [EmployeeID = 7, Location = "Vancouver"]
        },
        type table [EmployeeID = nullable number, Location = nullable text]
    ),
    "Location",
    "Location_Cleaned",
    [IgnoreCase = true, IgnoreSpace = true]
)

Tuloste

Table.FromRecords(
    {
        [EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
        [EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
        [EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
        [EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
        [EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
        [EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
        [EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
    },
    type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)