DataOperationsCatalog.ShuffleRows Metode
Definisi
Penting
Beberapa informasi terkait produk prarilis yang dapat diubah secara signifikan sebelum dirilis. Microsoft tidak memberikan jaminan, tersirat maupun tersurat, sehubungan dengan informasi yang diberikan di sini.
Acak baris input.
public Microsoft.ML.IDataView ShuffleRows(Microsoft.ML.IDataView input, int? seed = default, int shufflePoolSize = 1000, bool shuffleSource = true);
member this.ShuffleRows : Microsoft.ML.IDataView * Nullable<int> * int * bool -> Microsoft.ML.IDataView
Public Function ShuffleRows (input As IDataView, Optional seed As Nullable(Of Integer) = Nothing, Optional shufflePoolSize As Integer = 1000, Optional shuffleSource As Boolean = true) As IDataView
Parameter
- input
- IDataView
Data input.
- shufflePoolSize
- Int32
Jumlah baris yang akan ditahan di kumpulan. Mengatur ini ke 1 akan menonaktifkan pengacakan kumpulan dan ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean) hanya akan melakukan pengacakan dengan membaca input dalam urutan acak.
- shuffleSource
- Boolean
Jika false, transformasi tidak akan mencoba membaca input dalam urutan acak dan hanya menggunakan pengumpulan untuk mengacak. Parameter ini tidak berpengaruh jika CanShuffle properti adalah inputfalse.
Mengembalikan
Contoh
using System;
using System.Collections.Generic;
using Microsoft.ML;
namespace Samples.Dynamic
{
public static class ShuffleRows
{
// Sample class showing how to shuffle rows in
// IDataView.
public static void Example()
{
// Create a new context for ML.NET operations. It can be used for
// exception tracking and logging, as a catalog of available operations
// and as the source of randomness.
var mlContext = new MLContext();
// Get a small dataset as an IEnumerable.
var enumerableOfData = GetSampleTemperatureData(5);
var data = mlContext.Data.LoadFromEnumerable(enumerableOfData);
// Before we apply a filter, examine all the records in the dataset.
Console.WriteLine($"Date\tTemperature");
foreach (var row in enumerableOfData)
{
Console.WriteLine($"{row.Date.ToString("d")}" +
$"\t{row.Temperature}");
}
Console.WriteLine();
// Expected output:
// Date Temperature
// 1/2/2012 36
// 1/3/2012 36
// 1/4/2012 34
// 1/5/2012 35
// 1/6/2012 35
// Shuffle the dataset.
var shuffledData = mlContext.Data.ShuffleRows(data, seed: 123);
// Look at the shuffled data and observe that the rows are in a
// randomized order.
var enumerable = mlContext.Data
.CreateEnumerable<SampleTemperatureData>(shuffledData,
reuseRowObject: true);
Console.WriteLine($"Date\tTemperature");
foreach (var row in enumerable)
{
Console.WriteLine($"{row.Date.ToString("d")}" +
$"\t{row.Temperature}");
}
// Expected output:
// Date Temperature
// 1/4/2012 34
// 1/2/2012 36
// 1/5/2012 35
// 1/3/2012 36
// 1/6/2012 35
}
private class SampleTemperatureData
{
public DateTime Date { get; set; }
public float Temperature { get; set; }
}
/// <summary>
/// Get a fake temperature dataset.
/// </summary>
/// <param name="exampleCount">The number of examples to return.</param>
/// <returns>An enumerable of <see cref="SampleTemperatureData"/>.</returns>
private static IEnumerable<SampleTemperatureData> GetSampleTemperatureData(
int exampleCount)
{
var rng = new Random(1234321);
var date = new DateTime(2012, 1, 1);
float temperature = 39.0f;
for (int i = 0; i < exampleCount; i++)
{
date = date.AddDays(1);
temperature += rng.Next(-5, 5);
yield return new SampleTemperatureData
{
Date = date,
Temperature =
temperature
};
}
}
}
}
Keterangan
ShuffleRows(IDataView, Nullable<Int32>, Int32, Boolean) akan mengacak baris input IDataView apa pun menggunakan pendekatan streaming. Agar tidak memuat seluruh himpunan shufflePoolSize data dalam memori, kumpulan baris akan digunakan untuk memilih baris secara acak ke output. Kumpulan dibangun dari baris pertama shufflePoolSize di input. Baris kemudian akan dihasilkan secara acak dari kumpulan dan diganti dengan baris berikutnya dari input sampai semua baris telah dihasilkan, menghasilkan baru IDataView dengan ukuran yang sama seperti input tetapi dengan baris dalam urutan acak.
CanShuffle Jika properti dari input adalah benar, maka itu juga akan dibaca ke dalam kumpulan dalam urutan acak, menawarkan dua sumber keacakan.