Hỗ Trợ Trình tự chuẩn bị text cho ebook 2 lớp

Thảo luận trong 'Ebook truyện dịch' bắt đầu bởi bomnocham, 22/7/17.

  1. bomnocham

    bomnocham Bàn Long Chiến Đội

    Được thích:
    83
    Trình tự chuẩn bị text cho ebook 2 lớp
    Link file trình tự trên word:


    B1. Cách dùng software get text
    I. Tool get text:

    - Link tải soft ToolgettextV8-V9 tại

    http://www.mediafire.com/file/pe84r07d4el1j9f/ToolgettextV8-V9.rar
    - Chép soft vào thư mục bạn muốn lưu text sau khi tải, dạng text sau khi tải là HTML.

    1. Nội dung chính của soft:
    - Add: dán link nguồn truyện vào ô URL
    - Import: dán tập tin *.txt có chứa các đường lik nguồn truyện
    - Start: bắt đầu tải file
    - Options: điều chỉnh file text
    [​IMG]
    2. Hướng dẫn sử dụng:
    - Chọn Add → URL: dán link nguồn truyện vào ( trang đầu tiên của truyện) → End: 30000 →OK
    - Chỉnh mục Options tùy theo ý thích của bạn
    1/ Show Table of Contens: hiển thị mục lục
    2/ Show chapter’s title: hiển thị tên chương

    [​IMG]
    - Chọn link cần tải rồi chọn Start
    - Trong quá trình tải, bạn có thể dừng tải với 2 mục Stop và Stop All.

    II. Leech text do drakai9x viết

    Hướng dẫn sử dụng đọc tại: http://banlong.us/threads/tool-leechtext-cua-mot-so-web-truyen.12471/


    B2. Chuẩn bị text
    I. Dùng text tải từ Software tool get text
    - Mở file text truyện dưới dạng HTML với Word
    - Nhấn Ctrl+H tìm BEGIN
    - Bôi đen phần mục lục phía trên rồi xóa đi (nếu có)
    - Copy toàn bộ text sang Notepad+++
    - Trong Notepad++, nhấn Ctrl+H tìm _END_OF_CHAPTER_….
    - Chế độ Normal: Replace all _END_OF_CHAPTER_, ở dưới nhập dấu phân cách 2 chương - -o0o- -
    - Chế độ Normal: Replace all với Findwhat:_BEGIN_OF_CHAPTER_, Replace: để trống
    - Chế độ Normal: Replace all với Findwhat: “Không có nội dung”, Replace: để trống
    - Chép text đã chỉnh vào file HTML ban đầu
    - Chạy Macro B0_Mucluc1Click
    - Chạy Macro B3_DanhDauChuong
    - Chạy Macro B4_NgatHetChuong_Option
    - Save lại
    - Mở file HTML đã chỉnh với Notepad +++

    1. Tạo Source HTML (đã chạy Macro đánh dấu mục lục) cho file nguồn text
    - Edit > Line Operations > Remove Empty Lines (Containing blank characters)
    [​IMG]
    [​IMG]
    2. Fix chữ cái đầu dòng không viết hoa
    - Chế độ: Match Case + Regular Expression
    - Chạy lệnh replace all như sau:
    - Findwhat: ^(\l)
    - Replace: \u\1
    - Save

    3. Tạo Dropcap- Bôi đen chữ đầu tiên bắt đầu chương mới
    - Chế độ: Match Case + Regular Expression
    - Chạy lệnh replace all như sau:
    - Findwhat: (</h2>[^<p]+<p class=DeStyle>)(\u)
    - Replace: \1<span class=Dropcap>\2</span>
    - Save, đóng file lại

    4. Hiệu chỉnh text, xóa rác
    - Mở file HTML với Word
    - Click chuột phải vào ô Normal, chọn Select all…
    [​IMG]
    - Copy toàn bộ text
    - Mở Notepad +++ → New: Paste nội dung copy vào đây.
    - Chạy Macro Sửa lỗi thường gặp, Làm sạch text
    [​IMG]
    - Với file 50mb trở lên thì chia nhỏ ra khi chạy Macro Làm sạch text nhằm tránh treo máy
    - Khi chạy không thao tác Notepad+++.
    - Sau khi xong, nhấn Ctrl+H chọn chế độ Normal: Replace all với Findwhat:--o0o- -, Replace: - -o0o- -
    - Lưu file và chép text sang Word.

    II. Dùng text tải từ soft Leech text:
    1. Hiệu chỉnh text, xóa rác
    - Mở file text trong Notepad +++
    - Bỏ qua phần giới thiệu, đi đến tên truyện
    - Chọn chế độ Normal: Replace all với Findwhat: “Tên Truyện”, Replace: - -o0o- -
    - Chọn chế độ Normal: Replace all với Findwhat: “Tên tác giả”, Replace: để trống.
    - Copy toàn bộ text sang 1 trang mới
    - Chạy Macro Sửa lỗi thường gặp, Làm sạch text.
    - Với file 50mb trở lên thì chia nhỏ ra khi chạy Macro Làm sạch text nhằm tránh treo máy
    - Khi chạy không thao tác Notepad+++.
    - Sau khi xong, nhấn Ctrl+H chọn chế độ Normal: Replace all với Findwhat:--o0o- -, Replace: - -o0o- -
    - Lưu file, đổi tên file thành tên truyện và chép text sang Word. Xóa file text gốc ban đầu.
    - Mở file text chép trong Word: Save as → Others Formats → Web Page ( *.htm, *.html).
    [​IMG]
    [​IMG]
    - Tại file HTML vừa Save
    - Chạy Macro B0_Mucluc1Click
    - Chạy Macro B3_DanhDauChuong
    - Chạy Macro B4_NgatHetChuong_Option
    - Save lại
    - Mở file HTML đã chỉnh với Notepad +++

    2. Tạo Source HTML (đã chạy Macro đánh dấu mục lục) cho file nguồn text
    - Edit > Line Operations > Remove Empty Lines (Containing blank characters)
    [​IMG]
    3. Fix chữ cái đầu dòng không viết hoa
    - Chế độ: Match Case + Regular Expression
    - Chạy lệnh replace all như sau:
    - Findwhat: ^(\l)
    - Replace: \u\1
    - Save

    4. Tạo Dropcap- Bôi đen chữ đầu tiên bắt đầu chương mới
    - Chế độ: Match Case + Regular Expression
    - Chạy lệnh replace all như sau:
    - Findwhat: (</h2>[^<p]+<p class=DeStyle>)(\u)
    - Replace: \1<span class=Dropcap>\2</span>
    - Save, đóng file lại


    B3. Làm mục lục căn bản
    - Mở file HTML (đã chỉnh sửa) với Word, nhấp View → Macros → Views Macros
    - Chọn Macro: B0_MucLuc1Click
    [​IMG]

    B4. Hệ thống chương
    I. File text gộp
    - Chạy Macro B1_FixDauCach
    - Chạy Macro B2_BoDongTrang
    - Chạy Macro B3_DanhDauChuong
    - Chạy Macro B4_NgatHetChuong_Option
    - Chạy Macro B0_Mucluc1Click
    - Rà soát lại các mục đánh dấu chương xem có sót lỗi ở đâu không
    Chú ý: đa số các lỗi thường hiện ở dòng tác giả báo “ hôm nay đã chương 1:…”, sửa Chương 1:… thành một chương
    - Chạy Macro B0_Mucluc1Click lần nữa nếu có sửa chữa gì.

    II. File text tải bằng phần mềm lấy text
    - Chạy Macro B3_DanhDauChuong
    - Chạy Macro B4_NgatHetChuong_Option
    - Chạy Macro B0_Mucluc1Click
    - Rà soát lại các mục đánh dấu chương xem có sót lỗi ở đâu không
    Chú ý: đa số các lỗi thường hiện ở dòng tác giả báo “ hôm nay đã chương 1:…”, sửa Chương 1:… thành một chương
    - Chạy Macro B0_Mucluc1Click lần nữa nếu có sửa chữa gì.

    B5. Mục lục 2 lớp

    I. Chuẩn bị mục lục chương cho mục lục lớp 1
    - Tại dòng in mục lục lớp 2( mũi tên), nhấn References, chọn mục Table of Contens
    - Chọn Insert Table of Contens
    - Mục Show levels là 2
    - Bỏ chọn mục Right align page numbers trước, sau đó bỏ chọn mục Show page numbers như hình dưới. Nhấn OK
    [​IMG]

    II. Mục lục lớp 1
    - Chạy Macro B3_DanhDauChuong
    - Chạy Macro B4_NgatHetChuong_Option
    - Chạy Macro Decepticon_One
    - Nhấp vào dòng in mục lục lớp 1(mũi tên)
    - Nhấn References, chọn mục Table of Contens
    - Chọn Insert Table of Contens
    - Mục Show levels là 1
    - Bỏ chọn mục Right align page numbers trước, sau đó bỏ chọn mục Show page numbers. Chọn OK

    [​IMG]


    - Tại đây sẽ hiện 2 lần mục lục lớp 1, xóa mục lục lớp 1 phía dưới
    - Bôi đen từ dưới lên và chọn màu mình thích

    III. Mục lục lớp 2
    - Bôi đen từ dưới lên và chọn màu mình thích
    - Chọn màu khác cho dòng đánh dấu 50 chương
    - Lưu file hoàn thành chỉnh sửa
     
    Chỉnh sửa cuối: 29/7/17
    Poca, LonTaLonTon and ﻲA Bư✯ like this.
  2. LonTaLonTon

    LonTaLonTon Thành viên kích hoạt

    Được thích:
    161
    Đã đọc và chưa hiểu!:buon
     
    bomnocham and Poca like this.
  3. Poca

    Poca Bàn Long Chiến Đội

    Được thích:
    234
    Chỉ đọc không thôi thì không hiểu được đâu. Phải đọc và làm theo từng bước. Thì nó mới dễ hình dung và thấy dễ dàng :)
     
    bomnocham and LonTaLonTon like this.
  4. bomnocham

    bomnocham Bàn Long Chiến Đội

    Được thích:
    83
    Bài này mình làm với notepad+++ và word.
    File html sẽ thêm sau
     
    LonTaLonTon thích bài này.
  5. Decepticon

    Decepticon Moderator

    Được thích:
    253
    ảo diệu hơn cả ka 4 năm trước :cuoi13:
     
    bomnocham thích bài này.

Thành viên đang xem bài viết (Users: 0, Guests: 0)