DataOperationsCatalog.FilterRowsByMissingValues(IDataView, String[]) Método
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Quite filas donde cualquier columna de columns
contiene un valor que falta.
public Microsoft.ML.IDataView FilterRowsByMissingValues (Microsoft.ML.IDataView input, params string[] columns);
member this.FilterRowsByMissingValues : Microsoft.ML.IDataView * string[] -> Microsoft.ML.IDataView
Public Function FilterRowsByMissingValues (input As IDataView, ParamArray columns As String()) As IDataView
Parámetros
- input
- IDataView
Los datos de entrada.
- columns
- String[]
Nombre de las columnas en las que se va a filtrar. Si una fila tiene un valor que falta en cualquiera de estas columnas, se quitará del conjunto de datos.
Devoluciones
Ejemplos
using System;
using System.Collections.Generic;
using Microsoft.ML;
using Microsoft.ML.SamplesUtils;
namespace Samples.Dynamic
{
public class FilterRowsByMissingValues
{
/// <summary>
/// Sample class showing how to use FilterRowsByMissingValues.
/// </summary>
public static void Example()
{
// Create a new ML context, for ML.NET operations. It can be used for
// exception tracking and logging, as well as the source of randomness.
var mlContext = new MLContext();
// Create a small dataset as an IEnumerable.
var samples = new List<DataPoint>()
{
new DataPoint(){ Feature1 = 21, Feature2 = new [] { 1, 2, float.NaN}
},
new DataPoint(){ Feature1 = 40, Feature2 = new [] { 1f, 2f, 3f} },
new DataPoint(){ Feature1 = float.NaN, Feature2 = new [] { 1, 2,
float.NaN} }
};
// Convert training data to IDataView.
var data = mlContext.Data.LoadFromEnumerable(samples);
// Filter out any row with an NaN values in either column
var filteredData = mlContext.Data
.FilterRowsByMissingValues(data, new[] { "Feature1", "Feature2" });
// Take a look at the resulting dataset and note that rows with NaNs are
// filtered out. Only the second data point is left
var enumerable = mlContext.Data
.CreateEnumerable<DataPoint>(filteredData, reuseRowObject: true);
Console.WriteLine($"Feature1 Feature2");
foreach (var row in enumerable)
{
Console.WriteLine($"{row.Feature1}" +
$"\t({string.Join(", ", row.Feature2)})");
}
// Feature1 Feature2
//
// 40 (1, 2, 3)
}
private class DataPoint
{
public float Feature1 { get; set; }
public float[] Feature2 { get; set; }
}
}
}
Se aplica a
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de