Używanie usługi SCP z usługą Apache Hadoop w usłudze Azure HDInsight
Ten artykuł zawiera informacje na temat bezpiecznego przesyłania plików z klastrem usługi HDInsight.
Kopiowanie plików
Narzędzia scp
można użyć do kopiowania plików do i z poszczególnych węzłów w klastrze. Na przykład następujące polecenie kopiuje katalog test.txt
z systemu lokalnego do podstawowego węzła głównego:
scp test.txt sshuser@clustername-ssh.azurehdinsight.net:
Ponieważ po znaku :
nie określono ścieżki, plik zostanie umieszczony w katalogu macierzystym użytkownika sshuser
.
Poniższy przykład kopiuje plik test.txt
z katalogu macierzystego użytkownika sshuser
w podstawowym węźle głównym do systemu lokalnego:
scp sshuser@clustername-ssh.azurehdinsight.net:test.txt .
Narzędzie scp
może uzyskać dostęp tylko do systemu plików poszczególnych węzłów w klastrze. Nie można jej używać do uzyskiwania dostępu do danych w magazynie zgodnym z systemem plików HDFS dla klastra.
Użyj narzędzia scp
, jeśli musisz przekazać zasób do użycia z sesji SSH. Na przykład przekaż skrypt języka Python, a następnie uruchom go z sesji SSH.
Aby uzyskać informacje o bezpośrednim ładowaniu danych do magazynu zgodnego z systemem HDFS, zobacz następujące dokumenty:
Następne kroki
- Używanie protokołu SSH z usługą HDInsight
- Use edge nodes in HDInsight (Używanie węzłów krawędzi w usłudze HDInsight)