Coderja 1 month ago
Coderja #tutorial

Cara Menghapus baris duplikat atau baris ganda

Beberapa metode untuk menghapus "duplicate lines" atau baris ganda dari sebuah file txt menggunakan metode populer

Tentu, mari kita bahas cara menghapus baris duplikat dari file teks (.txt) menggunakan beberapa metode populer:

1. Menggunakan Command Prompt (CMD) Windows:

Script:

Bash

sort file.txt | uniq > new_file.txt

Penjelasan:

  1. sort: Mengurutkan baris dalam file.txt. Pengurutan diperlukan agar baris duplikat bersebelahan.
  2. uniq: Membaca input yang diurutkan dan menghapus baris yang berurutan dan identik.
  3. >: Mengarahkan output ke file baru bernama new_file.txt.


2. Menggunakan PowerShell:

Script:

PowerShell

Get-Content file.txt | Select-Object -Unique > new_file.txt

Penjelasan:

  1. Get-Content: Membaca isi file.txt.
  2. Select-Object -Unique: Memilih objek unik (baris) dari input.
  3. >: Mengarahkan output ke new_file.txt.


3. Menggunakan Python:

Script:

Python

lines_seen = set()  # Menyimpan baris yang sudah dilihat
with open("file.txt", "r") as f, open("new_file.txt", "w") as outfile:
    for line in f:
        if line not in lines_seen:  # Jika baris belum ada, tulis ke file baru
            outfile.write(line)
            lines_seen.add(line)

Penjelasan:

  1. lines_seen: Set untuk menyimpan baris yang sudah ditemui. Set menjamin keunikan elemen.
  2. Buka file.txt dalam mode baca (r) dan new_file.txt dalam mode tulis (w).
  3. Iterasi setiap baris dalam file.txt.
  4. Jika baris belum ada di lines_seen, tulis baris tersebut ke new_file.txt dan tambahkan ke lines_seen.


Metode Tambahan:

  • Menggunakan Notepad++: Jika Anda memiliki Notepad++, Anda dapat menggunakan plugin "TextFX" untuk menghapus duplikat dengan mudah.
  • Menggunakan Perangkat Lunak Pihak Ketiga: Ada banyak perangkat lunak pengolah teks yang memiliki fitur bawaan untuk menghapus baris duplikat.


Pertimbangan Tambahan:

  • Sensitivitas Huruf Besar-Kecil: Metode di atas membedakan huruf besar dan kecil. Jika Anda ingin menghapus duplikat tanpa membedakan huruf besar-kecil, Anda perlu memodifikasi skrip (misalnya, dengan mengubah semua huruf menjadi huruf kecil sebelum perbandingan).
  • Baris Kosong: Jika Anda ingin mempertahankan baris kosong, Anda perlu menyesuaikan skrip agar baris kosong tidak dihapus.


Contoh Penggunaan:

Misalkan file.txt berisi:

apel
jeruk
apel
mangga
jeruk

Setelah menjalankan salah satu skrip di atas, new_file.txt akan berisi:

apel
jeruk
mangga

Semoga penjelasan ini membantu Anda memahami cara menghapus baris duplikat dari file teks!

Extract email addresses from a text file using notepad++

Extract email addresses from a text file using notepad++

defaultuser.png
Coderja
1 month ago
Url Extractor Python Script

Url Extractor Python Script

defaultuser.png
Coderja
1 month ago
Time Ago to Date Format Converter

Time Ago to Date Format Converter

defaultuser.png
Coderja
1 month ago
Menambahkan baris code kedalam file

Menambahkan baris code kedalam file

defaultuser.png
Coderja
1 month ago
Setingan Standar Litespeed Cache

Setingan Standar Litespeed Cache

defaultuser.png
Coderja
3 weeks ago