Tool_Script Sửa Lỗi Chính Tả Tự Động Với EmEditor và Notepad++ Kết Hợp

  1. Decepticon

    Decepticon Thành viên kích hoạt

    Tham gia ngày:
    24/4/13
    Bài viết:
    950
    Được thích:
    266
    lão Big phát triển tiếp bản cũ được không? bản cũ của lão kết hợp với script lọc tên để replace tên nhân vật rất tiện cơ mà có 1 vấn đề khá bực là danh sách lỗidữ liệu text phải copy vào typing_errors.txt src_txt.html chứ ko được tùy chọn, cả regex cũng ko có nốt. Ngoài ra nếu đặt "dấu cách" ở đầu hoặc cuối đều sẽ bị lỗi, ví dụ :
    [ ]ừê=[ ]trê hay nli[ ]=nh[ ] trong đó [ ] là dấu cách nhé

    http://banlong.us/forum/threads/100...i-emeditor-va-notepad-ket-hop.html#post472562



    P/s: Bản mới ở #1 nếu có hướng dẫn bằng video thì tốt. Đọc mà mụ hết cả đầu != =)
     
    Chỉnh sửa cuối: 11/8/14
  2. Big Bang

    Big Bang Thành viên kích hoạt

    Tham gia ngày:
    3/9/12
    Bài viết:
    391
    Được thích:
    130
    EmEditor bản mới nhất vẫn bị lỗi cũ (sai whole word tiếng Việt). Cái bản này ta xài không được, bực mình không xài nữa.

    Nếu muốn replace cho đúng thì phải xài Notepad++ thôi. Script EmEditor dùng để tạo macro Notepad++ tự động. Nếu lão thích thì ta share.

    Bộ công cụ tạo macro notepad++ này còn có thể dùng để giải quyết phần mất nhiều thời gian nhất là làm sạch text. Format text không mất nhiều thời gian nhưng phải tính toán nên phải làm bằng EmEditor. Macro notepad++ không tính toán được.
     
  3. lomcom

    lomcom Thành viên kích hoạt

    Tham gia ngày:
    6/11/13
    Bài viết:
    60
    Được thích:
    25
    Dear all

    Ta dùng 1 file excel, có 2 sheet để sửa lỗi chính tả

    1 sheet main (chứa text) (cột tìm kiếm thay thế là cột 3 - cột C)
    1 sheet data thay thế (2 cột, 1 cột tìm kiếm, 1 cột thay thế)

    sau đó chạy macro

    có thể làm nhiều file, mỗi file 1 chức năng, ví dụ, file chuyên chỉnh sửa lỗi chính tả từ scan, file chuyên chỉnh sửa tên riêng


    • nhược điểm của cách làm này là text ít thôi, chừng 100 chương đổ lại, phải làm 2 công đoạn, copy text bỏ vào file, chạy macro

    đang suy nghĩ vụ dùng regex, chưa test

    thật ra vẫn có thể dùng regex để chạy với excel, nhưng phải dùng thông qua vba, lý do regex đã được tích hợp vào visual basic 6, nên hoàn toàn có thể sử dụng được, sẽ nghiên cứu vụ này để chạy ngon luôn


    • ưu điểm thay đổi phần change dễ dàng, hỗ trợ unicode, chạy cũng lẹ, test với text của nhật nguyệt đương không, quyển 4 từ chương 1 đến chương 197, 12000 dòng, replace khá nhanh.

    nếu decep đã có list lỗi, thì chạy test thử xem thế nào

    Link
     
    Chỉnh sửa cuối: 10/12/14
  4. Decepticon

    Decepticon Thành viên kích hoạt

    Tham gia ngày:
    24/4/13
    Bài viết:
    950
    Được thích:
    266
    what? lão lom share mỗi cái bảng excel thì test kiểu gì :(

    À. vẫn dùng macro của lão Bang, thực ra ta ko dùng excel vì thông thường danh sách sẽ theo thứ tự Whole Word => Match Case => Normal nên nhớ mấy cái {0, 1, 2} và {512, 513, 514..} là đủ rồi :D


    Ai giải thích giùm

    <Action type="0" message="2012" wParam="0" lParam="0" sParam="" />
    <Action type="0" message="2175" wParam="0" lParam="0" sParam="" />
    <Action type="0" message="2316" wParam="0" lParam="0" sParam="" />

    là cái chi ko, xóa đi hình như chả sao cả :)
     
    Chỉnh sửa cuối: 4/1/15
  5. Decepticon

    Decepticon Thành viên kích hoạt

    Tham gia ngày:
    24/4/13
    Bài viết:
    950
    Được thích:
    266
    Theo ta lão nên phát triển tiếp v1 vì 95% dữ liệu không cần Whole Word, có thể replace bằng v1 rất dễ dàng và tiện lợi. Việc dồn tất cả vào shortcuts.xml như ở v2 sẽ khiến N++ chạy ì ạch, mất công trong việc cập nhật. V2 phù hợp với dữ liệu nhỏ như name truyện, lỗi đả tự cần Whole Word

    Ngoài ra cái generate_npp_macro.jsee bị thiếu nhiều ký tự vô cùng như > “ " ” < and 100% chữ Tàu
     
    Chỉnh sửa cuối: 4/1/15

Thành viên đang xem bài viết (Users: 0, Guests: 0)