Bagikan melalui


DataOperationsCatalog.ShuffleRows Metode

Definisi

Acak baris input.

public Microsoft.ML.IDataView ShuffleRows (Microsoft.ML.IDataView input, int? seed = default, int shufflePoolSize = 1000, bool shuffleSource = true);
member this.ShuffleRows : Microsoft.ML.IDataView * Nullable<int> * int * bool -> Microsoft.ML.IDataView
Public Function ShuffleRows (input As IDataView, Optional seed As Nullable(Of Integer) = Nothing, Optional shufflePoolSize As Integer = 1000, Optional shuffleSource As Boolean = true) As IDataView

Parameter

input
IDataView

Data input.

seed
Nullable<Int32>

Benih acak. Jika tidak ditentukan, status acak akan berasal dari MLContext.

shufflePoolSize
Int32

Jumlah baris yang akan ditahan di kumpulan. Mengatur ini ke 1 akan menonaktifkan pengacakan kumpulan dan ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean) hanya akan melakukan pengacakan dengan membaca input dalam urutan acak.

shuffleSource
Boolean

Jika false, transformasi tidak akan mencoba membaca input dalam urutan acak dan hanya menggunakan pengumpulan untuk mengacak. Parameter ini tidak berpengaruh jika CanShuffle properti adalah inputfalse.

Mengembalikan

Contoh

using System;
using System.Collections.Generic;
using Microsoft.ML;

namespace Samples.Dynamic
{
    public static class ShuffleRows
    {
        // Sample class showing how to shuffle rows in 
        // IDataView.
        public static void Example()
        {
            // Create a new context for ML.NET operations. It can be used for
            // exception tracking and logging, as a catalog of available operations
            // and as the source of randomness.
            var mlContext = new MLContext();

            // Get a small dataset as an IEnumerable.
            var enumerableOfData = GetSampleTemperatureData(5);
            var data = mlContext.Data.LoadFromEnumerable(enumerableOfData);

            // Before we apply a filter, examine all the records in the dataset.
            Console.WriteLine($"Date\tTemperature");
            foreach (var row in enumerableOfData)
            {
                Console.WriteLine($"{row.Date.ToString("d")}" +
                    $"\t{row.Temperature}");
            }
            Console.WriteLine();
            // Expected output:
            //  Date    Temperature
            //  1/2/2012        36
            //  1/3/2012        36
            //  1/4/2012        34
            //  1/5/2012        35
            //  1/6/2012        35

            // Shuffle the dataset.
            var shuffledData = mlContext.Data.ShuffleRows(data, seed: 123);

            // Look at the shuffled data and observe that the rows are in a
            // randomized order.
            var enumerable = mlContext.Data
                .CreateEnumerable<SampleTemperatureData>(shuffledData,
                reuseRowObject: true);

            Console.WriteLine($"Date\tTemperature");
            foreach (var row in enumerable)
            {
                Console.WriteLine($"{row.Date.ToString("d")}" +
                $"\t{row.Temperature}");
            }
            // Expected output:
            //  Date    Temperature
            //  1/4/2012        34
            //  1/2/2012        36
            //  1/5/2012        35
            //  1/3/2012        36
            //  1/6/2012        35
        }

        private class SampleTemperatureData
        {
            public DateTime Date { get; set; }
            public float Temperature { get; set; }
        }

        /// <summary>
        /// Get a fake temperature dataset.
        /// </summary>
        /// <param name="exampleCount">The number of examples to return.</param>
        /// <returns>An enumerable of <see cref="SampleTemperatureData"/>.</returns>
        private static IEnumerable<SampleTemperatureData> GetSampleTemperatureData(
            int exampleCount)

        {
            var rng = new Random(1234321);
            var date = new DateTime(2012, 1, 1);
            float temperature = 39.0f;

            for (int i = 0; i < exampleCount; i++)
            {
                date = date.AddDays(1);
                temperature += rng.Next(-5, 5);
                yield return new SampleTemperatureData
                {
                    Date = date,
                    Temperature =
                    temperature
                };

            }
        }
    }
}

Keterangan

ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean) akan mengacak baris input IDataView apa pun menggunakan pendekatan streaming. Agar tidak memuat seluruh himpunan shufflePoolSize data dalam memori, kumpulan baris akan digunakan untuk memilih baris secara acak ke output. Kumpulan dibangun dari baris pertama shufflePoolSize di input. Baris kemudian akan dihasilkan secara acak dari kumpulan dan diganti dengan baris berikutnya dari input sampai semua baris telah dihasilkan, menghasilkan baru IDataView dengan ukuran yang sama seperti input tetapi dengan baris dalam urutan acak. CanShuffle Jika properti dari input adalah benar, maka itu juga akan dibaca ke dalam kumpulan dalam urutan acak, menawarkan dua sumber keacakan.

Berlaku untuk