Partilhar via


Marshalling padrão para strings

Tanto as classes como System.Text.StringBuilder as System.String têm um comportamento de agrupamento semelhante.

As cadeias de caracteres são agrupadas como um tipo de estilo BSTR COM ou como uma cadeia de caracteres terminada em nulo (uma matriz de caracteres que termina com um caractere nulo). Os caracteres dentro da cadeia de caracteres podem ser empacotados como Unicode (o padrão em sistemas Windows) ou ANSI.

Strings usadas em interfaces

A tabela a seguir mostra as opções de empacotamento para o tipo de dados de cadeia de caracteres quando empacotado como um argumento de método para código não gerenciado. O MarshalAsAttribute atributo fornece vários UnmanagedType valores de enumeração para marshal strings para interfaces COM.

Tipo de enumeração Descrição do formato não gerenciado
UnmanagedType.BStr (padrão) Um estilo BSTR COM com um comprimento prefixado e caracteres Unicode.
UnmanagedType.LPStr Um ponteiro para uma matriz terminada em nulo de caracteres ANSI.
UnmanagedType.LPWStr Um ponteiro para uma matriz terminada em nulo de caracteres Unicode.

Esta tabela aplica-se a String. Para StringBuilder, as únicas opções permitidas são UnmanagedType.LPStr e UnmanagedType.LPWStr.

O exemplo a seguir mostra cadeias de caracteres declaradas IStringWorker na interface.

public interface IStringWorker
{
    void PassString1(string s);
    void PassString2([MarshalAs(UnmanagedType.BStr)] string s);
    void PassString3([MarshalAs(UnmanagedType.LPStr)] string s);
    void PassString4([MarshalAs(UnmanagedType.LPWStr)] string s);
    void PassStringRef1(ref string s);
    void PassStringRef2([MarshalAs(UnmanagedType.BStr)] ref string s);
    void PassStringRef3([MarshalAs(UnmanagedType.LPStr)] ref string s);
    void PassStringRef4([MarshalAs(UnmanagedType.LPWStr)] ref string s);
}
Public Interface IStringWorker
    Sub PassString1(s As String)
    Sub PassString2(<MarshalAs(UnmanagedType.BStr)> s As String)
    Sub PassString3(<MarshalAs(UnmanagedType.LPStr)> s As String)
    Sub PassString4(<MarshalAs(UnmanagedType.LPWStr)> s As String)
    Sub PassStringRef1(ByRef s As String)
    Sub PassStringRef2(<MarshalAs(UnmanagedType.BStr)> ByRef s As String)
    Sub PassStringRef3(<MarshalAs(UnmanagedType.LPStr)> ByRef s As String)
    Sub PassStringRef4(<MarshalAs(UnmanagedType.LPWStr)> ByRef s As String)
End Interface

O exemplo a seguir mostra a interface correspondente descrita em uma biblioteca de tipos.

interface IStringWorker : IDispatch
{
    HRESULT PassString1([in] BSTR s);
    HRESULT PassString2([in] BSTR s);
    HRESULT PassString3([in] LPStr s);
    HRESULT PassString4([in] LPWStr s);
    HRESULT PassStringRef1([in, out] BSTR *s);
    HRESULT PassStringRef2([in, out] BSTR *s);
    HRESULT PassStringRef3([in, out] LPStr *s);
    HRESULT PassStringRef4([in, out] LPWStr *s);
};

Strings usadas na plataforma invocam

Quando o CharSet é Unicode ou um argumento string é explicitamente marcado como [MarshalAs(UnmanagedType.LPWSTR)] e a string é passada por value (not ref ou out), a string é fixada e usada diretamente pelo código nativo. Caso contrário, a invocação da plataforma copia argumentos de cadeia de caracteres, convertendo do formato .NET Framework (Unicode) para o formato não gerenciado da plataforma. As cadeias de caracteres são imutáveis e não são copiadas de volta da memória não gerenciada para a memória gerenciada quando a chamada retorna.

O código nativo só é responsável por liberar a memória quando a cadeia de caracteres é passada por referência e atribui um novo valor. Caso contrário, o tempo de execução do .NET possui a memória e a liberará após a chamada.

A tabela a seguir lista as opções de empacotamento para strings quando empacotadas como um argumento de método de uma chamada de invocação de plataforma. O MarshalAsAttribute atributo fornece vários UnmanagedType valores de enumeração para marshal strings.

Tipo de enumeração Descrição do formato não gerenciado
UnmanagedType.AnsiBStr Um estilo BSTR COM com um comprimento prefixado e caracteres ANSI.
UnmanagedType.BStr Um estilo BSTR COM com um comprimento prefixado e caracteres Unicode.
UnmanagedType.LPStr (padrão) Um ponteiro para uma matriz terminada em nulo de caracteres ANSI.
UnmanagedType.LPTStr Um ponteiro para uma matriz terminada em nulo de caracteres dependentes da plataforma.
UnmanagedType.LPUTF8Str Um ponteiro para uma matriz terminada em nulo de caracteres codificados UTF-8.
UnmanagedType.LPWStr Um ponteiro para uma matriz terminada em nulo de caracteres Unicode.
UnmanagedType.TBStr Um estilo BSTR COM com um comprimento prefixado e caracteres dependentes da plataforma.
VBByRefStr Um valor que permite que o Visual Basic altere uma cadeia de caracteres em código não gerenciado e tenha os resultados refletidos no código gerenciado. Esse valor é suportado apenas para invocar plataforma. Este é o valor padrão no Visual Basic para ByVal cadeias de caracteres.

Esta tabela aplica-se a String. Para StringBuilder, as únicas opções permitidas são LPStr, LPTStr, e LPWStr.

A definição de tipo a seguir mostra o uso correto de para chamadas de invocação de MarshalAsAttribute plataforma.

class StringLibAPI
{
    [DllImport("StringLib.dll")]
    public static extern void PassLPStr([MarshalAs(UnmanagedType.LPStr)] string s);
    [DllImport("StringLib.dll")]
    public static extern void PassLPWStr([MarshalAs(UnmanagedType.LPWStr)] string s);
    [DllImport("StringLib.dll")]
    public static extern void PassLPTStr([MarshalAs(UnmanagedType.LPTStr)] string s);
    [DllImport("StringLib.dll")]
    public static extern void PassLPUTF8Str([MarshalAs(UnmanagedType.LPUTF8Str)] string s);
    [DllImport("StringLib.dll")]
    public static extern void PassBStr([MarshalAs(UnmanagedType.BStr)] string s);
    [DllImport("StringLib.dll")]
    public static extern void PassAnsiBStr([MarshalAs(UnmanagedType.AnsiBStr)] string s);
    [DllImport("StringLib.dll")]
    public static extern void PassTBStr([MarshalAs(UnmanagedType.TBStr)] string s);
}
Class StringLibAPI
    Public Declare Auto Sub PassLPStr Lib "StringLib.dll" (
        <MarshalAs(UnmanagedType.LPStr)> s As String)
    Public Declare Auto Sub PassLPWStr Lib "StringLib.dll" (
        <MarshalAs(UnmanagedType.LPWStr)> s As String)
    Public Declare Auto Sub PassLPTStr Lib "StringLib.dll" (
        <MarshalAs(UnmanagedType.LPTStr)> s As String)
    Public Declare Auto Sub PassLPUTF8Str Lib "StringLib.dll" (
        <MarshalAs(UnmanagedType.LPUTF8Str)> s As String)
    Public Declare Auto Sub PassBStr Lib "StringLib.dll" (
        <MarshalAs(UnmanagedType.BStr)> s As String)
    Public Declare Auto Sub PassAnsiBStr Lib "StringLib.dll" (
        <MarshalAs(UnmanagedType.AnsiBStr)> s As String)
    Public Declare Auto Sub PassTBStr Lib "StringLib.dll" (
        <MarshalAs(UnmanagedType.TBStr)> s As String)
End Class

Cordas usadas em estruturas

Strings são membros válidos de estruturas; no entanto, StringBuilder os buffers são inválidos em estruturas. A tabela a seguir mostra as opções de empacotamento para o String tipo de dados quando o tipo é empacotado como um campo. O MarshalAsAttribute atributo fornece vários UnmanagedType valores de enumeração para organizar cadeias de caracteres para um campo.

Tipo de enumeração Descrição do formato não gerenciado
UnmanagedType.BStr Um estilo BSTR COM com um comprimento prefixado e caracteres Unicode.
UnmanagedType.LPStr (padrão) Um ponteiro para uma matriz terminada em nulo de caracteres ANSI.
UnmanagedType.LPTStr Um ponteiro para uma matriz terminada em nulo de caracteres dependentes da plataforma.
UnmanagedType.LPUTF8Str Um ponteiro para uma matriz terminada em nulo de caracteres codificados UTF-8.
UnmanagedType.LPWStr Um ponteiro para uma matriz terminada em nulo de caracteres Unicode.
UnmanagedType.ByValTStr Uma matriz de caracteres de comprimento fixo; O tipo da matriz é determinado pelo conjunto de caracteres da estrutura que a contém.

O ByValTStr tipo é usado para matrizes de caracteres embutidas de comprimento fixo que aparecem dentro de uma estrutura. Outros tipos se aplicam a referências de cadeia de caracteres contidas em estruturas que contêm ponteiros para cadeias de caracteres.

O CharSet argumento do que é aplicado à estrutura que contém determina o formato de StructLayoutAttribute caracteres de cadeias de caracteres em estruturas. As estruturas de exemplo a seguir contêm referências de cadeia de caracteres e cadeias de caracteres embutidas, bem como ANSI, Unicode e caracteres dependentes de plataforma. A representação dessas estruturas em uma biblioteca de tipos é mostrada no seguinte código C++:

struct StringInfoA
{
    char *  f1;
    char    f2[256];
};

struct StringInfoW
{
    WCHAR * f1;
    WCHAR   f2[256];
    BSTR    f3;
};

struct StringInfoT
{
    TCHAR * f1;
    TCHAR   f2[256];
};

O exemplo a seguir mostra como usar o MarshalAsAttribute para definir a mesma estrutura em formatos diferentes.

[StructLayout(LayoutKind.Sequential, CharSet = CharSet.Ansi)]
struct StringInfoA
{
    [MarshalAs(UnmanagedType.LPStr)] public string f1;
    [MarshalAs(UnmanagedType.ByValTStr, SizeConst = 256)] public string f2;
}

[StructLayout(LayoutKind.Sequential, CharSet = CharSet.Unicode)]
struct StringInfoW
{
    [MarshalAs(UnmanagedType.LPWStr)] public string f1;
    [MarshalAs(UnmanagedType.ByValTStr, SizeConst = 256)] public string f2;
    [MarshalAs(UnmanagedType.BStr)] public string f3;
}

[StructLayout(LayoutKind.Sequential, CharSet = CharSet.Auto)]
struct StringInfoT
{
    [MarshalAs(UnmanagedType.LPTStr)] public string f1;
    [MarshalAs(UnmanagedType.ByValTStr, SizeConst = 256)] public string f2;
}
<StructLayout(LayoutKind.Sequential, CharSet := CharSet.Ansi)> _
Structure StringInfoA
    <MarshalAs(UnmanagedType.LPStr)> Public f1 As String
    <MarshalAs(UnmanagedType.ByValTStr, SizeConst := 256)> _
    Public f2 As String
End Structure

<StructLayout(LayoutKind.Sequential, CharSet := CharSet.Unicode)> _
Structure StringInfoW
    <MarshalAs(UnmanagedType.LPWStr)> Public f1 As String
    <MarshalAs(UnmanagedType.ByValTStr, SizeConst := 256)> _
    Public f2 As String
<MarshalAs(UnmanagedType.BStr)> Public f3 As String
End Structure

<StructLayout(LayoutKind.Sequential, CharSet := CharSet.Auto)> _
Structure StringInfoT
    <MarshalAs(UnmanagedType.LPTStr)> Public f1 As String
    <MarshalAs(UnmanagedType.ByValTStr, SizeConst := 256)> _
    Public f2 As String
End Structure

Buffers de cadeia de caracteres de comprimento fixo

Em algumas circunstâncias, um buffer de caracteres de comprimento fixo deve ser passado para código não gerenciado para ser manipulado. Simplesmente passar uma cadeia de caracteres não funciona neste caso porque o destinatário não pode modificar o conteúdo do buffer passado. Mesmo que a cadeia de caracteres seja passada por referência, não há como inicializar o buffer para um determinado tamanho.

A solução é passar um byte[] ou char[], dependendo da codificação esperada, como o argumento em vez de um String. A matriz, quando marcada com [Out], pode ser desreferenciada e modificada pelo destinatário, desde que não exceda a capacidade da matriz alocada.

Por exemplo, a função de API do Windows GetWindowText (definida em winuser.h) requer que o chamador passe um buffer de caracteres de comprimento fixo para o qual a função grava o texto da janela. O lpString argumento aponta para um buffer de tamanho nMaxCountalocado pelo chamador. Espera-se que o chamador aloque o buffer e defina o nMaxCount argumento para o tamanho do buffer alocado. O exemplo a seguir mostra a declaração de GetWindowText função conforme definido em winuser.h.

int GetWindowText(
    HWND hWnd,        // Handle to window or control.
    LPTStr lpString,  // Text buffer.
    int nMaxCount     // Maximum number of characters to copy.
);

A char[] pode ser desreferenciado e modificado pelo destinatário. O exemplo de código a seguir demonstra como ArrayPool<char> pode ser usado para pré-alocar um char[]arquivo .

using System;
using System.Buffers;
using System.Runtime.InteropServices;

internal static class NativeMethods
{
    [DllImport("User32.dll", CharSet = CharSet.Unicode)]
    public static extern void GetWindowText(IntPtr hWnd, [Out] char[] lpString, int nMaxCount);
}

public class Window
{
    internal IntPtr h;        // Internal handle to Window.
    public string GetText()
    {
        char[] buffer = ArrayPool<char>.Shared.Rent(256 + 1);
        NativeMethods.GetWindowText(h, buffer, buffer.Length);
        return new string(buffer);
    }
}
Imports System
Imports System.Buffers
Imports System.Runtime.InteropServices

Friend Class NativeMethods
    Public Declare Auto Sub GetWindowText Lib "User32.dll" _
        (hWnd As IntPtr, <Out> lpString() As Char, nMaxCount As Integer)
End Class

Public Class Window
    Friend h As IntPtr ' Friend handle to Window.
    Public Function GetText() As String
        Dim buffer() As Char = ArrayPool(Of Char).Shared.Rent(256 + 1)
        NativeMethods.GetWindowText(h, buffer, buffer.Length)
        Return New String(buffer)
   End Function
End Class

Outra solução é passar um StringBuilder como o argumento em vez de um String. O buffer criado ao organizar um StringBuilder pode ser desreferenciado e modificado pelo destinatário, desde que não exceda a capacidade do StringBuilder. Ele também pode ser inicializado em um comprimento fixo. Por exemplo, se você inicializar um StringBuilder buffer com uma capacidade de N, o marshaller fornecerá um buffer de caracteres de tamanho (N+1). O +1 explica o fato de que a cadeia de caracteres não gerenciada tem um terminador nulo, enquanto StringBuilder não.

Nota

Em geral, passar StringBuilder argumentos não é recomendado se você estiver preocupado com o desempenho. Para obter mais informações, consulte Parâmetros de cadeia de caracteres.

Consulte também