Tool-Script eBookWorm - Bộ Script Làm eBook Của Big Bang

Thảo luận trong 'Ebook truyện dịch' bắt đầu bởi Big Bang, 23/9/15.

  1. Big Bang

    Big Bang Thành viên kích hoạt

    Được thích:
    130
    eBookWorm - Bộ Script Làm eBook Của Big Bang


    Hướng Dẫn Cài Đặt


    eBookWorm là bộ script tôi đang dùng để làm ebook thay cho bộ cũ. Bộ script này tôi gần như viết mới hoàn toàn. EmEditor và Notepad++ đã tốt hơn rất nhiều so với lúc tôi viết bộ cũ. Bộ script mới tận dụng những features mới của 2 phần mềm này.
    Tuy EmEditor đã tốt hơn phiên bản cũ rất nhiều nhưng vẫn khá chậm so với Notepad++. Nếu làm hơn 1k chương thì tốc độ kém hơn khoảng 10 lần. Nhưng Notepad++ lại không hỗ trợ script trong khi có rất nhiều thứ cần tính toán.
    Bộ script mới kết hợp 2 phần mềm này để bù trừ lẫn nhau: phần dọn rác, chuẩn hóa dấu câu,... nói chung là những thứ tối thiểu cho một quyển sách sẽ làm trên Notepad++, còn phần format, tính toán làm trên EmEditor.
    Phần dọn rác tôi cũng viết một bản trên EmEditor nhưng thử hết cách nó vẫn không ngửi khói Notepad++ được vì tụt lại quá xa: khi dọn rác trên 1k chương Notepad++ mất khoảng 5-6 phút, EmEditor bắt tôi ngồi đuổi ruồi hơn 1h đồng hồ.
    Nếu bạn muốn dùng bản dọn rác của EmEditor thì không được la ó. Bạn thích tự hành hạ mình thì đó không phải lỗi tại tôi.

    Cài Đặt Mới:
    1. Download Phần Mềm
    - Download bộ script eBookWorm 1.0 tại đây
    - Vào trang download của EmEditor tại đây, download bản 64-bit nếu Windows của bạn là 64-bit. Bản 64-bit chạy nhanh hơn 32-bit. Nếu bạn đã cài EmEditor thì kiểm tra version không được cũ hơn 15.0 .
    - Vào trang chủ của Notepad++ tại đây, download bản mới nhất về. Nếu bạn đã cài Notepad++ thì kiểm tra version không cũ hơn 6.5
    - Vào trang download của WinRAR tại đây, download về nếu bạn chưa cài WinRAR
    - Vào trang download của Active Python tại đây. Nhớ chọn bản 2.7, không được chọn bản 3.x . Active Python dùng để tách file MOBI của Kindle, gói script kindleunpack cũ không chạy được python mới. Chọn bản 64-bit nếu Windows của bạn là 64-bit.
    - Vào trang download của KindleGen tại đây.
    - Vào trang download của Unikey tại đây và download UVConverter 1.1.3b cho Windows

    2. Cài Đặt
    - chấp nhận mặc định khi cài đặt của các phần mềm
    - ghi nhớ đường dẫn của WinRAR.exe và ActivePython, nếu là cài đặt mặc định thì sẽ là C:\Program Files\WinRAR\WinRAR.exeC:\Python27\python.exe
    - Giải nén eBookWorm.rar và copy vào máy tính. Tuy eBookWorm không bị lỗi khi copy vào folder có tên tiếng Việt hoặc ký tự lạ, có khoảng trắng nhưng tốt nhất là bạn copy vào folder chỉ có tên từ các chữ cái tiếng Anh. Tốt nhất là copy vào folder gốc các ổ đĩa như C:\, D:\, E:\ , khi đó folder của bộ script sẽ là C:\eBookWorm, D:\eBookWorm hoặc E:\eBookWorm. Bạn có thể tạo một shortcut trên desktop cho tiện. Tôi thì làm shortcut đến folder eBookWorm\eBooks để làm truyện cho nhanh.
    - Copy file kindlegen.exe vào folder eBookWorm\eBookWorm_Builder
    - Copy file uvconv.exe vào folder eBookWorm\tools

    3. Thiết Lập
    Trong phần này bạn sẽ cài đặt các option cho các phần mềm để tạo môi trường chạy bộ script.

    3.1 EmEditor

    3.1.1 Cài đặt EmEditor hỗ trợ tiếng Việt
    - Vào menu Tools-->Customize... , vào thẻ Edit của hộp thoại
    [​IMG]
    Hình 1​
    - Gõ thêm chữ cái tiếng Việt có dấu vào ô Treat the following characters as alphanumeric (không được xóa chữ đã có từ trước trong đó)
    Mã:
    đàáảãạăằắẳẵặâầấẩẫậèéẻẽẹêềếểễệìíỉĩịòóỏõọôồốổỗộơờớởỡợùúủũụưừứửữựỳýỷỹỵ
    3.1.2 Cài đặt tìm kiếm
    - Vào trang Search
    [​IMG]
    Hình 2​
    - Bỏ tích ở vòng tròng số 1, vòng tròn số 2 gõ vào 1000 thay vì 100 như trong hình
    - Nhấn OK để hoàn tất 3.1.1 và 3.1.2

    3.1.3 Cài đặt highlight
    - Chọn menu Tools-->Select Configuration-->Define Configurations...
    [​IMG]
    Hình 3​
    - Chọn New (số 1 trong hình 3), chấp nhận mặc định ở hộp thoại nhỏ
    - Sửa tên configuration mới thêm vào thành eBookWorm (số 2)
    - Nhấn nút Property (số 3 trong hình)
    [​IMG]
    Hình 4​
    -Vào thẻ Highlight (1) rồi nhấn nút Import, bạn import file eBookWorm\tools\ebw.esy
    - Chọn "Yes" nếu EmEditor hỏi bạn "Remove old items?...", import xong bạn sẽ thấy trong khung Highlight Word hiện ra một đám bắt đầu bằng EBWC_
    - Vào thẻ File như ở hình 5 và gõ ebw vào ô Default Extension, nhấn OK
    [​IMG]
    Hình 5​
    - Nhấn Close ở hộp thoại hình 3
    - Mở file eBookWorm\template\eBook.ebw bằng EmEditor, nếu bạn thấy những dòng có 2 dấu gạch xéo ở đầu ( \\ ) có màu xanh, một số chữ ở dưới có màu đỏ, vậy là mọi chuyện OK.

    3.2 Notepad++
    - Nếu Notepad++ đang chạy thì tắt nó đi
    - Vào Windows Explorer (nhấn phím Windows + E) , trong thanh Address Bar gõ vào %appdata%\Notepad++
    - Backup file shortcuts.xml trong đó rồi copy file eBookWorm\tools\shortcuts.xml đè lên file cũ.
    - Mở Notepad++ lên, kiểm tra menu Macro, nếu thấy 2 macro Sửa Lỗi Thường GặpLàm Sạch Text là OK.

    3.3 Cung Cấp Đường Dẫn Cho Batch Script (*.bat)
    - Bạn vào Notepad++ rồi mở eBookWorm\template\build_kindle.bat
    - Tìm dòng
    SET master_script=E:\eBookWorm\eBookWorm_Builder\eBookWorm_Kindle_Builder.bat
    và thay đường dẫn đó bằng đường dẫn file eBookWorm_Kindle_Builder.bat nơi bạn cài bộ script. Ví dụ bạn cài bộ script vào C:\eBookWorm thì chỉ cần thay ổ đĩa E: thành C: là OK, và dòng đó sẽ trông thế này:
    SET master_script=C:\eBookWorm\eBookWorm_Builder\eBookWorm_Kindle_Builder.bat
    - Save rồi đóng nó lại
    - mở eBookWorm\template\build_epub.bat
    - tìm dòng
    SET master_script=E:\eBookWorm\eBookWorm_Builder\eBookWorm_ePub_Builder.bat
    rồi thay nó bằng đường dẫn file eBookWorm_ePub_Builder.bat giống như ở phần trên
    - Bạn mở file eBookWorm\eBookWorm_Builder\eBookWorm_Kindle_Builder.bat rồi tìm dòng REM _BEGIN_PROGRAM_PATH_SECTION_

    [​IMG]
    Hình 6​
    - Ở ngay dưới dòng đó là một đám đường dẫn đến các chương trình. Đường dẫn cho Active Python và WinRAR bạn làm ở mục số 2 Cài Đặt
    - Các đường dẫn cho các file có sẵn trong eBookWorm như kindlegen.exe, kindleunpack.pyUpload bạn sửa giống như ở trên. Nếu bạn cài bộ script vào thẳng ổ C:\ thì chỉ cần sửa một chữ, nếu bạn cài vào ổ E:\ giống như tôi thì có lẽ không phải sửa gì cả.
    - Bạn mở file eBookWorm\eBookWorm_Builder\eBookWorm_ePub_Builder.bat, tìm dòng REM _BEGIN_PROGRAM_PATH_SECTION_
    - Ở file này chỉ cần sửa đường dẫn của WinRAR.exe và Upload giống như trên
    - Save tất cả các file.

    4. Cài Macro Của Bộ Script

    - Vào menu Macros-->Customize...

    Hình 7​
    - Nhấn nút New để thêm macro, bạn vào folder ebookWorm\scripts rồi lần lượt thêm các macro theo thứ tự sau:

    create_new_ebook.jsee
    init_project.jsee
    convert_to_precompound.jsee
    capitalize_collect_titles.jsee
    format_text.jsee
    update_ebook.jsee
    format_optional_content.jsee
    apply_volume_titles.jsee
    add_remove_proj_files.jsee
    build_mobi.jsee
    gen_merge_list.jsee
    merge_renum_chapters.jsee
    change_ebook_style.jsee
    import_project.jsee
    export_project.jsee

    Cách Nâng Cấp / Cập Nhật Căn Bản:
    Trong phần này tôi sẽ hướng dẫn cách nâng cấp hoặc cập nhật eBookWorm chung cho mọi phiên bản. Đây là cách nâng cấp / cập nhật căn bản, mỗi bản cập nhật / nâng cấp có thể yêu cầu làm thêm một số thứ. Những gì cần phải làm thêm sẽ được hướng dẫn cụ thể ở từng bản cập nhật / nâng cấp.

    Cách làm:
    + Tắt EmEditor và Notepad++
    + Rename folder cài đặt eBookWorm để backup, ví dụ rename C:\eBookWorm thành C:\eBookWorm_old
    + Download và giải nén bản nâng cấp / cập nhật rồi copy vào vị trí cũ khi cài eBookWorm 1.0
    + Chuyển tất cả truyện đã làm bằng bộ script phiên bản cũ sang folder eBookWorm\eBooks của bộ script phiên bản mới (ví dụ copy tất cả từ C:\eBookWorm_old\eBooks sang C:\eBookWorm\eBooks)
    PS:
    - mai viết hướng dẫn sử dụng. Cảm ơn sự kiên nhẫn của quý vị.
    - lúc nãy viết thiếu một đoạn, mọi người coi lại nhé.
    - Forum không cho quá 6 hình trong một bài viết, mọi người nếu không tìm được lão Cường HIV mà kêu thì chịu khó tưởng tượng khi cài đặt nhé. Phần hướng dẫn có lẽ nhiều hơn 6 hình, thuộc loại bài tập luyện trí tưởng tượng nâng cao. :))

    24-9-2015: Cập nhật hướng dẫn cài đặt + download links

    25-9-2015: Cập nhật hướng dẫn cài đặt

    1-11-2015: Cập nhật eBookWorm: version 1.1
    Download bộ script eBookWorm 1.1 tại đây
    Hướng dẫn cài đặt:
    - Cài đặt mới: giống như hướng dẫn cài eBookWorm 1.0 ở trên
    - Cập nhật:
    + Áp dụng cập nhật căn bản
    + Nâng cấp macro của Notepad++ : làm như hướng dẫn ở phần 3.3 phần Hướng Dẫn Cài Đặt​

    Thay đổi trong eBookWorm 1.1
    + Thêm tính năng: script tạo Kindle eBook dễ sử dụng hơn. Thêm chức năng kiểm tra lỗi (errors) và cảnh báo (warnings) khi tạo Kindle eBook. Nếu có cảnh báo thì xuất ra cảnh báo trong file eBook_KindleGen_Report.txt (kindlegen.exe vẫn tạo ra eBook, chỉ có điều có kèm theo cảnh báo). Nếu có lỗi (kindlegen.exe không tạo ra được eBook) thì tự động chuyển qua chế độ chạy dò lỗi và xuất kết quả ra eBook_KindleGen_Report.txt. Xem file eBookWorm\template\build_mobi.bat để biết thêm chi tiết.
    + Cải thiện tính năng export eBook: nếu truyện có phần mở đầu, tự chương... thì nội dung của prologue.html sẽ được xuất ra trước nội dung truyện (các chương). Như vậy những người cần text sạch để làm eBook bằng những bộ script / macro khác sẽ dễ theo dõi hơn.
    + Cải thiện macro Làm Sạch Text của Notepad++ .​

    Chú ý:
    - Với những truyện cũ đã làm với eBookWorm 1.0 thì vẫn dùng build_mobi.bat bản cũ. Điều này không ảnh hưởng nhiều lắm, bản mới chỉ dễ dùng hơn thôi, các chức năng chính vẫn như cũ. Nếu bạn chưa bao giờ sửa build_mobi.bat thì cứ tiếp tục dùng nó.
    - Nếu bạn muốn dùng bản mới thì có thể export truyện rồi import trở lại. Bạn nào biết lập trình *.BAT thì sửa trực tiếp file build_mobi.bat cho nhanh (thay code bên dưới SET master_script=E:\eBookWorm\eBookWorm_Builder\eBookWorm_Kindle_Builder.bat của bản cũ bằng bản mới).

    2-11-2015: Cập nhật eBookWorm: version 1.2
    Download bộ script eBookWorm 1.2 tại đây

    Hướng dẫn cài đặt:
    - Cài đặt mới: giống như hướng dẫn cài eBookWorm 1.0 ở trên
    - Cập nhật:
    + Áp dụng cập nhật căn bản
    + Nâng cấp macro của Notepad++ : Nếu nâng cấp từ bản 1.0 thì làm như hướng dẫn ở phần 3.3 phần Hướng Dẫn Cài Đặt, nếu nâng cấp từ bản 1.1 thì không cần.​

    Thay đổi trong eBookWorm 1.2
    + Thêm tính năng: script merge_renum_chapters.jsee có thêm lựa chọn cập nhật danh sách chương sau khi gộp / đánh lại số chương. Điều này tương đương với việc có thể thực hiện bước 3.1.8 trong phần Hướng Dẫn Sử Dụng chỉ bằng 1 script merge_renum_chapters.jsee (trước đây phải chạy 2 script merge_renum_chapters.jseecapitalize_collect_titles.jsee). Nếu người dùng cẩn thận vẫn có thể thực hiện bằng 2 script như trước.
    + Sửa lỗi: import_project.jsee thiếu module chaptitle.jsee
     
    Chỉnh sửa cuối: 2/11/15
    babylong10, Chpn, airplane92 and 13 others like this.
  2. Big Bang

    Big Bang Thành viên kích hoạt

    Được thích:
    130
    eBookWorm - Bộ Script Làm eBook Của Big Bang


    Hướng Dẫn Sử Dụng


    Giới Thiệu:

    eBookWorm là bộ script làm eBook tiếng Việt cho truyện có số lượng chương lớn. Không có giới hạn số chương và số quyển, tuy bộ script chỉ dự trù cho 50 quyển nhưng bạn có thể dễ dàng thêm vào với zero công sức. Tôi nghĩ con số này cũng đã đủ cho những truyện dài lê thê. Dĩ nhiên nó cũng có thể dùng để làm truyện ngắn với số chương 10-20.

    eBookWorm chủ yếu nhắm vào Kindle eBook thế hệ mới nhất (KF8), đây là loại eBook rất đẹp khi coi trên Kindle for Android tablet. eBook chuẩn EPUB3 cũng được eBookWorm hỗ trợ, nói chính xác hơn là Kindle KF8 hỗ trợ một phần chuẩn EPUB3. EPUB3 là chuẩn chung cho các eBook đời mới. eBookWorm tạo ra eBook EPUB và Kindle KF8 đều dùng các file HTML giống nhau, về nguyên tắc chúng phải có chất lượng tương đương, nhưng trên thực tế coi Kindle eBook đẹp hơn hẳn EPUB. Đây là vấn đề của chương trình đọc eBook chứ không phải của eBookWorm, cũng giống như một cô gái đẹp khi đến dạ hội và khi làm bếp trông khác hẳn nhau.

    eBookWorm tuân theo chuẩn EPUB3 (HTML5 & CSS3). Đây là chuẩn mới nhất để làm eBook, bảo đảm bộ script có thể dùng trong một thời gian dài. Thiết kế của eBook chủ yếu dựa trên Amazon Kindle Publishing Guidelines, là hướng dẫn của Amazon.com dành cho sách thương phẩm. Thiết kế dựa trên Android tablet 7", với kích thước này trông nó giống như một quyển sách in cỡ nhỏ. Bạn cũng có thể làm vài điều chỉnh nhỏ nếu dùng tablet có kích thước lớn hơn. Đối với phone với màn hình nhỏ thì hiển thị hình bìa có thể không đạt vì hình bìa làm sách thương phẩm luôn có kích thước khá lớn, nhưng phần nội dung vẫn có chất lượng giống như khi coi trên tablet.

    Một quyển sách chất lượng thương phẩm cần khá nhiều thứ. eBookWorm chỉ giúp bạn làm eBook nhanh và chuẩn xác, nó không giúp bạn thu thập những thứ cần thiết để làm eBook. Những thứ cần để làm eBook được gom cả vào một chỗ, eBookWorm sẽ đặt mỗi thứ vào đúng vị trí của nó mà không cần bạn phải mất công lo lắng. Tất cả những thứ cần thiết đều có mẫu mặc định, trừ nội dung truyện (tất nhiên rồi). Có nghĩa là bạn chỉ cần cung cấp nội dung là đã có thể làm eBook được ngay, sau này khi kiếm "đồ chơi" về chỉ cần copy đè lên phần mặc định là được.

    eBookWorm làm eBook truyện dịch, nhưng truyện Vietphrase cũng có thể dùng để làm eBook, miễn là đánh số chương bằng số như truyện dịch chứ không phải bằng chữ như kiểu đệ tam bách thập thất chương.

    1. Sử Dụng Bộ Script Thế Nào Mới Đúng?
    1.1 Nguyên tắc căn bản: bạn là ông chủ nhà in, eBookWorm là công nhân của bạn
    Cùng một mẩu thông tin có thể xuất hiện ở nhiều chỗ khác nhau, ví dụ như tên tác giả có thể được in trên hình bìa hay những chỗ khác, tựa chương có thể có trong 2-3 loại mục lục hay trong nội dung truyện,...

    Dựng trang chỗ này, dời chương chỗ kia, tô màu chỗ này, phóng to chỗ kia,... Đó là những gì cần làm ở một quyển eBook, cho dù chỉ vài chương hay vài ngàn chương. Đừng làm thay eBookWorm, đừng khiến công nhân của bạn thất nghiệp. Nó làm những chuyện tỉ mỉ đó nhanh và chính xác hơn bạn rất nhiều. Việc của bạn là đi kiếm nội dung truyện về, quẳng cho eBookWorm và bảo nó làm theo ý bạn. Bạn là BOSS.

    1.2 Nắm chắc thiết kế trong tay và đừng quên ra lệnh
    Bạn phải nắm chắc eBook thuộc loại gì và mình muốn ebook trông như thế nào. Hãy chọn mẫu thiết kế mình thích và làm những điều chỉnh nếu cần. Đừng quên ra lệnh cho eBookWorm thực hiện những thay đổi ngay sau đó.

    Thiết kế của bạn chính là file eBook.ebw, trong đó có hầu như tất cả thông tin cần để làm eBook. Khi bạn thay đổi thiết kế phải nhớ chạy các script tương ứng để thực hiện thay đổi trong thiết kế. Nếu bạn quên, thiết kế và thực tế có thể không phù hợp và ở lần "ra lệnh" tiếp theo, công nhân của bạn có thể gây ra tai nạn lao động.

    1.3 Làm lại từ đầu nhanh hơn sửa
    Máy tính trung bình (Core i5 2.5GHz, 8GB RAM) export một truyện mất khoảng 1 phút, import 1 truyện không quá 5 phút. Vì vậy nếu truyện của bạn có sai sót gì mà phải sửa mất thời gian trên 5 phút, tốt hơn cả là bạn export truyện ra, sửa lỗi rồi import trở lại. Một khi xảy ra sai sót, thường là sẽ sai ở nhiều chỗ phải sửa bằng tay rất mất thời gian. eBookWorm không có phần sửa lỗi do format, update, v.v. Nó chỉ có thể sửa lỗi chính tả hàng loạt theo danh sách bạn soạn. Vì vậy nếu phải sửa vài lỗi format trở lên, ví dụ như khi text nguồn thiếu vài tựa chương, tốt hơn cả là bạn export ra, sửa lại ở một vài chỗ trong file text rồi import trở lại thay vì phải lục tung vài file đầy nhóc mã nguồn HTML.

    1.4 Chia sẻ thông tin - dùng lại những thứ đã có sẵn
    Text bạn export ra có thể dùng với những bộ script khác. Có nhiều bộ macro rất tốt chạy trên MS Word, Calibre, Aspose.Words Express,...
    Những thông tin về tác giả, ảnh tác giả,... có thể dùng lại cho những quyển sách khác và được chia sẻ dễ dàng. Điều này sẽ tiết kiệm công sức của bạn mà vẫn bảo đảm chất lượng sách.

    Bạn có thể chia sẻ các mẫu thiết kế với những người khác. eBookWorm hiện có 74 mẫu có sẵn nhưng con số này có thể tăng lên rất dễ dàng và nhanh chóng. Các mẫu thiết kế được sinh ra hàng loạt bằng script nên về nguyên tắc không có giới hạn về số lượng và sai sót được hạn chế ở mức tối thiểu. Sau khi sinh ra hàng loạt các mẫu còn có thể được tinh chỉnh để dùng lại nhiều lần hay chia sẻ với người khác.

    2. Các Thành Phần Của Bộ Script
    Bộ script gồm có 3 phần chính: script chạy trên EmEditor và Notepad++, một bộ dữ liệu / file mẫu để làm eBook, một số tools hỗ trợ đi kèm.

    2.1 Script
    2.1.1 Script (macro) Notepad++
    Macro cho Notepad++ có 2 cái: Làm Sạch TextSửa Lỗi Thường Gặp.

    Làm Sạch Text dọn dẹp text rác, chuẩn hóa dấu câu, thống nhất cách bỏ dấu tiếng Việt (bỏ dấu kiểu cũ),... Đây có lẽ công đoạn quan trọng nhất, khối lượng công việc nhiều nhất và cũng ít được chú ý nhất khi làm eBook. Giống như khi chạy xe ngoài đường, người ta nhìn đường, nhìn nhau, soi xe của nhau có xịn không, màu sắc kiểu dáng có "Hai Lúa" không... Chả ai thèm để ý đến cái bánh xe. Cái bánh xe thì có gì mà coi chứ, liệu nó có thể biến thành hình vuông được sao? Không ai thèm để mắt đến nó, cho đến khi xe cán đinh và tông vào đâu đó...

    Sửa Lỗi Thường Gặp sửa một số lỗi chính tả và đánh máy thường gặp nhất, ví dụ như sửa thúc dục thành thúc giục, che dấu thành che giấu. Nhiều người dịch không nắm vững từ vựng, dịch từ bản Vietphrase sai be bét mà không biết, cứ bê nguyên xi vào bản dịch.

    2.1.2 Script EmEditor
    Script dùng trong eBookWorm chủ yếu là script chạy trên EmEditor. Tất cả script EmEditor đều nằm trong folder eBookWorm\scripts. Dưới đây là danh sách script xếp theo vần alphabet và mô tả ngắn gọn. Phần hướng dẫn sử dụng sẽ nói kỹ hơn. Trong phần cài đặt, chỉ những script được sử dụng thường xuyên mới được đưa vào danh sách script/macro của EmEditor. Những script còn lại người dùng thêm vào nếu muốn dùng và nên xóa khỏi danh sách khi dùng xong để đỡ nhầm lẫn và chiếm chỗ.

    add_remove_proj_files.jsee: thêm file cần và xóa file không dùng đến khi bạn thay đổi thiết kế eBook.

    apply_volume_titles.jsee: Thay dòng giữ chỗ của tựa quyển bằng tựa quyển thật sự. Khi format text của truyện chia nhiều quyển, tựa các quyển được thay bằng những dòng giữ chỗ (ví dụ EBWP_VOLUME_2_TITLE giữ chỗ cho tựa quyển 2). Bạn cần phải chạy script này khi đã cập nhật tên quyển.

    AutoCorrect.jsee: Sửa lỗi chính tả hàng loạt theo danh sách được soạn trước.

    build_epub.jsee: tạo file EPUB

    build_mobi.jsee: tạo file AZW3 (Kindle KF8) và MOBI

    capitalize_collect_titles.jsee: viết hoa tựa chương và lấy danh sách chương

    capitalize_titles.jsee: viết hoa tựa chương

    change_ebook_style.jsee: thay đổi kiểu dáng của eBook (1 trong 74 mẫu có sẵn)

    check_ToC.jsee: kiểm tra tính liên tục của danh sách chương, tìm chương bị thừa / thiếu

    clean_text.jsee: xóa text rác

    collect_chapter_titles.jsee: lấy danh sách chương

    convert_to_precompound.jsee: convert text từ unicode tổ hợp (chữ và dấu tách rời, ví dụ chữ á do chữ adấu sắc hợp lại) sang unicode dựng sẵn (chữ và dấu dính liền thành 1 chữ không tách rời). Unicode tổ hợp vì chữ và dấu bị tách rời nên khi phóng to thu nhỏ text dấu hay bị lệch, rất xấu.

    create_new_ebook.jsee: copy các file mẫu để làm một eBook mới

    export_index.jsee: trích lấy text từ file "bảng chú dẫn" (index.html)

    export_project.jsee: export text nguồn từ các file HTML của truyện và gom thông tin truyện & text nguồn vào 1 file duy nhất.

    format_optional_content.jsee: format text có liên quan đến truyện (nhưng không phải nội dung) như tiểu sử tác giả, giới thiệu truyện,... thành HTML để copy vào các file tương ứng.

    format_text.jsee: format text nguồn (nội dung truyện) đã được làm sạch thành HTML

    generate_ebook_styles.jsee: script dùng để tạo hàng loạt kiểu dáng cho eBook

    gen_merge_list.jsee: tạo danh sách để gộp các chương, ví dụ Chương 2: Aaa Bbb Ccc (Thượng), Chương 3: Aaa Bbb Ccc (Hạ) thành Chương 2-3: Aaa Bbb Ccc

    gen_renum_list.jsee: tạo danh sách để đánh lại số chương. Dùng cho truyện đã dịch (viết) xong. Nhiều khi tác giả hay người dịch đánh sai số chương khiến số chương không liên tục. Chạy script này để lên danh sách đánh lại số chương cho liên tục.

    import_index.jsee: import text vào file "bảng chú dẫn" (index.html)

    import_project.jsee: import text vào một ebook mới, text nguồn được export bằng script export_project.jsee

    init_project.jsee: khởi tạo ebook. Chuẩn bị các file mẫu dựa theo thông tin trong file ebook.ebw.

    merge_renum_chapters.jsee: thực hiện các thay đổi dựa theo danh sách do gen_merge_list.jseegen_renum_list.jsee sinh ra.

    name_filter.jsee: lọc tên riêng trong truyện. Danh sách tên riêng dùng trong nhiều chuyện, ví dụ để thống nhất viết hoa. Nhiều khi do đánh máy tên riêng lắm lúc không được viết hoa đầy đủ, trông không hay. Hoặc danh sách tên riêng còn dùng để tạo các chú dẫn (chú thích) trong file index.html.

    script_template.jsee: mẫu để viết script cho eBookWorm, dành cho những ai muốn mở rộng tính năng của bộ script.

    search_unicode_ranges.jsee: tìm các ký tự (chữ) thuộc một dải nào đó. KindleGen khi tạo eBook sẽ quét toàn bộ nội dung để quyết định eBook có thể dùng những loại font chữ nào. Nhiều khi chỉ vì lẫn vào một vài ký tự trời ơi đất hỡi nào đó (do convert, do vietphrase, do MS Word làm lẫn vào) khiến cho nhiều font chữ đẹp không được đưa vào danh sách chọn font của Kindle Reader. Ngoài ra những ký tự này khi lên sách trông rất xấu, làm giảm chất lượng eBook. Kiếm bằng tay vài ký tự trong cả cuốn sách cả ngàn chương là chuyện không thể, bạn cần một cái radar như search_unicode_ranges.jsee

    temp_batch.bat: file mẫu batch script

    update_ebook.jsee: cập nhật text đã format thành HTML bằng format_text.jsee vào truyện

    update_epub_files.jsee: cập nhật các file nội dung để làm EPUB

    modules: folder này chứa các thư viện (modules) để lập trình bộ script.

    2.2 Bộ Dữ Liệu Mẫu
    Bộ dữ liệu mẫu làm eBook gồm các file mẫu, font chữ và hình mặc định.

    2.2.1 File Mẫu
    Các file mẫu ở trong thư mục eBookWorm\template, khi làm một eBook mới eBookWorm tạo một bản copy của những file này. Các file đó bao gồm (theo thứ tự xuất hiện trong eBook):

    front_cover.html: trang bìa trước. Đây là file bắt buộc khi làm eBook.

    front_matters.html: trang bìa lót, thông tin nhà xuất bản, dịch giả, trang web chia sẻ eBook. Đây là file bắt buộc.

    table_of_contents.html: trang mục lục HTML 2 lớp. Đây là file bắt buộc.

    epub_nav_doc.html: tương tự mục lục NCX nhưng đời mới hơn. Đây là file bắt buộc.

    acknowledgement.html: lời cảm ơn của tác giả với những người giúp mình viết và xuất bản sách. Lời cảm ơn dịch giả đã đưa truyện đến với độc giả Việt nam cũng có thể để ở đây. Trang này không bắt buộc.

    biography.html: trang giới thiệu tác giả (không bắt buộc)

    introduction.html: trang giới thiệu tác phẩm (không bắt buộc, nhưng rất cần thiết)

    prologue.html: trang dẫn truyện, chương mở đầu, tự chương, giới thiệu bối cảnh câu chuyện,... (không bắt buộc)

    book_contents.html: trang nội dung truyện chứa các chương truyện (bắt buộc).

    epilogue.html: phần kết, cảm nghĩ của tác giả, hậu truyện (không bắt buộc)

    index.html: bảng chú thích ý nghĩa từ hán việt, tên riêng, chú thích,... (không bắt buộc)

    back_cover.html: trang bìa sau (bắt buộc)

    Các file hỗ trợ quá trình làm eBook:

    eBook.opf: file chứa thông tin làm eBook. KindleGen.exe và các trình đọc eBook cần file này để hiển thị đúng.

    eBook.css: file quy định format (màu sắc, cỡ chữ,...) của eBook

    build_kindle.bat: file batch script để gọi chương trình KindleGen.exe tạo eBook AZW3 & MOBI

    build_epub.bat: file batch script để gọi chương trình WinRAR.exe tạo eBook EPUB.

    eBook.ebw: file thiết kế cho eBook của eBookWorm, quy định kiểu dáng, các file thành phần, font chữ,... eBookWorm dùng file này để quản lý quá trình làm eBook

    book_export.ebw: dùng để chứa text export-import truyện

    src_txt.html: file hỗ trợ quá trình làm eBook, chứa text nguồn. Hầu hết những khâu quan trọng nhất đều thực hiện trên file này.

    tmp.html: file hỗ trợ quá trình làm eBook, chứa danh sách các chương làm mục lục, text export,...

    tmp2.html, tmp3.html: file hỗ trợ quá trình làm eBook, dùng trong rất nhiều khâu.

    regex.txt: file chứa một số regular expression thường gặp nhất khi cần xử lý bằng tay. Ví dụ một số thứ rác ít gặp và khó xóa bạn phải làm bằng tay, hoặc khi kiểm tra nhanh dòng đầu và cuối các chương bạn cần dùng đến các RegEx trong này.

    Các folder:

    custom_imgs: folder chứa hình cần để làm eBook

    imgs: folder chứa hình dùng để làm eBook.

    Chú ý: hình cầndùng để làm eBook không giống nhau. Ví dụ nếu sách chia nhiều quyển thì hình bìa cho 50 quyển sẽ được copy vào custom_imgs, nhưng nếu truyện chỉ có 18 quyển thì chỉ có 18 hình bìa được copy vào imgs để làm eBook. Hình có trong imgs chắc chắn sẽ xuất hiện trong truyện, hình trong custom_imgs thì chưa chắc.

    emb_fonts: folder chứa font nhúng vào eBook

    ePub: folder chứa các file làm EPUB.

    Chú ý quan trọng: không được xóa hay đổi tên các file
    Bạn có thể copy đè lên hình mẫu nhưng không được xóa nó hay đổi tên. Đối với các file HTML thì tên và encoding của chúng (UTF-16, UTF-8) phải được giữ nguyên. Không được xóa hay lưu với encoding khác cho dù ebook của bạn không dùng đến. Bộ script chỉ làm việc với những file chuẩn đó thôi: đúng tên và đúng encoding.

    2.2.2 Font chữ và hình
    Font chữ của bộ script được để trong folder eBookWorm\emb_fonts. Font chữ cần để làm eBook sẽ được copy từ đây.

    Hình của bộ script được để trong eBookWorm\images

    Chú ý quan trọng:
    - Không được xóa, đổi tên hay copy đè lên các file font chữ (file *.ttf)
    - Các file hình trong eBookWorm\images\forum_logos, eBookWorm\images\publisher_logos, eBookWorm\images\volume_covers, đều là tên chuẩn. Bạn có thể copy đè lên nhưng không được xóa hay đổi tên.

    2.3 Các Tools Hỗ Trợ
    eBookWorm dùng 3 tools ngoài để hỗ trợ quá trình làm eBook:
    - eBookWorm\tools\uvconv.exe dùng để convert unicode tổ hợp sang dựng sẵn. eBookWorm chỉ chạy tốt với text uncode dựng sẵn.
    - eBookWorm\eBookWorm_Builder\kindlegen.exe của Amazon.com dùng để tạo eBook AZW3 & MOBI
    - Gói script python "KindleUnpack" dùng để tách AZW3 và MOBI ra khỏi file MOBI gộp do kindlegen.exe tạo ra. Bộ script này được để trong folder eBookWorm\eBookWorm_Builder\KindleUnpack

    eBookWorm sẽ dùng các tool hỗ trợ này khi cần, bạn không cần phải quan tâm đến chúng.

    3. Xử Lý Nội Dung Truyện
    Có 3 tình huống thường gặp nhất khi làm eBook với eBookWorm: làm truyện mới từ đầu, cập nhật truyện đang làm dở và import-export truyện.

    Tùy theo từng tình huống mà bạn sẽ chạy những script khác nhau. Chú ý mỗi script của eBookWorm chỉ chạy với một hoặc hai file gọi là file đích của script. Script có thể thay đổi nội dung file đích hoặc lấy thông tin trong đó để tác động lên những file khác. Ngoại lệ duy nhất là create_new_ebook.jsee, nó có thể chạy mà không cần file đích.

    3.1 Làm Truyện Mới Từ Đầu
    Thực hiện theo các bước sau:
    3.1.1 Tạo truyện mới bằng script create_new_ebook.jsee.
    Bạn sẽ nhập tên truyện khi được hỏi. Tên truyện dùng chữ Việt có dấu bình thường, đây không phải là tên file. Sau đó script sẽ hỏi bạn truyện có chia quyển hay không. Truyện có chia quyển thì các quyển luôn bắt đầu từ chương 1. Truyện chia quyển nhưng số chương quyển sau vẫn tiếp nối quyển trước (như Phàm Nhân Tu Tiên) thì không được coi là truyện chia thành quyển. Coi kỹ phần hướng dẫn về cách phân loại truyện trong file eBook.ebw.
    Khi script kết thúc các file cần để làm eBook được copy vào 1 folder mới trong eBookWorm\eBooks do script tạo ra. Tên folder này lấy từ tên truyện nhưng không có dấu, khoảng trắng được thay bằng dấu gạch dưới (underscore)

    3.1.2 Điền các thông tin về truyện vào eBook.ebw
    Bạn làm theo hướng dẫn trong file eBook.ebw. Khi create_new_ebook.jsee kết thúc nó mở eBook.ebw ra và điền sẵn tên truyện cho bạn. Bạn điền tiếp những thông tin còn thiếu hay đổi giá trị mặc định theo ý mình.

    Hình bìa trước-sau, hình tác giả, hình bìa quyển ... bạn copy đè lên file mặc định của bộ script trong folder custom_imgs. Nếu chưa kiếm được thì bạn cứ dùng hình do bộ script cung cấp, sau này cập nhật cũng được.

    3.1.3 Khởi tạo truyện mới bằng script init_project.jsee
    init_project.jsee đọc thông tin trong eBook.ebw và tiến hành các bước chuẩn bị cho các file làm eBook: copy những file cần, bỏ bớt những file không cần, thay những dòng giữ chỗ trong các file HTML bằng thông tin bạn điền vào... Ví dụ tên tác giả trong các file HTML mẫu lúc đầu là dòng giữ chỗ EBWP_AUTHOR_NAME, init_project.jsee sẽ thay tất cả những dòng giữ chỗ đó bằng tên thật của tác giả.

    3.1.4 Copy text nội dung truyện vào src_txt.html rồi chạy script convert_to_precompound.jsee
    Text này bạn lấy bằng tool GetText hay copy bằng tay từ trang web. Chú ý macro dọn rác chạy tốt nhất nếu được lấy bằng các tool GetText, cuối mỗi chương có một dòng _END_OF_CHAPTER_. script convert_to_precompound.jsee sẽ gọi uvconv.exe để biến text của bạn từ unicode tổ hợp thành dựng sẵn.

    3.1.5 Mở src_txt.html bằng Notepad++ rồi chạy lần lượt 2 macro Làm Sạch TextSửa Lỗi Thường Gặp. Bạn có thể tiếp tục xóa những text rác khó tìm hay chỉnh sửa đôi chút nếu cần. Save file khi đã hoàn tất.

    Chú ý quan trọng:
    Để tăng tốc, 2 script của Notepad++ đều tắt chức năng Undo, vì vậy dù cho file src_txt.html có thay đổi cỡ nào đi nữa thì Menu và Toolbar cho lệnh Save cũng bị tắt đi (Notepad++ coi file của bạn không bị thay đổi nên nó tắt lệnh Save đi). Để Save được bạn gõ thêm một khoảng trắng ở đâu đó rồi xóa nó đi, lúc này nút Save trên toolbar lại hoạt động trở lại.

    3.1.6 Chạy script capitalize_collect_titles.jsee
    Quay lại EmEditor, trả lời "Yes" khi được hỏi bạn có Reload file src_txt.html hay không. Bạn chạy capitalize_collect_titles.jsee để viết hoa tựa chương và gom danh sách tựa chương vào tmp.html

    3.1.7 Chạy script gen_merge_list.jsee
    gen_merge_list.jsee tạo danh sách để gom các chương bị chia nhỏ thành một chương gộp. Ví dụ bạn có 3 chương truyện với tựa như sau:

    Chương 120: Trước Cuộc Chiến (1)
    Chương 121-122: Trước Cuộc Chiến (2 + 3)
    Chương 123: Trước Cuộc Chiến (4)

    gen_merge_list.jsee sẽ tìm cách gom 3 chương đó lại thành 1 chương gộp:

    Chương 120-123: Trước Cuộc Chiến

    Những chương có thể gộp và gộp như thế nào được xuất ra file tmp2.html. Những chương lỗi được xuất ra file tmp3.html. Ngay cả khi bạn không định gộp chương bạn cũng nên chạy script này để kiểm tra text nguồn có bị thừa / thiếu chương hay không. tmp3.html liệt kê danh sách chương bị lỗi.

    Nếu text của bạn không có lỗi hoặc đã sửa hết lỗi và bạn định gộp chương thì làm tiếp bước 3.1.8, nếu không thì bỏ qua và làm tiếp bước 3.1.9

    3.1.8 chạy script merge_renum_chapters.jsee để gộp chương, sau đó chạy capitalize_collect_titles.jsee để cập nhật lại danh sách các chương sau khi gộp.

    3.1.9 chạy script format_text.jsee để format text thành code HTML. Nếu text của bạn có trên 1000 chương, EmEditor có thể sẽ mất vài phút để format. Bạn xem thống kê của script sau khi chạy để biết thêm chi tiết.

    3.1.10 chạy script update_ebook.jsee để cập nhật text đã format vào các file HTML. Save All nếu không có lỗi gì xảy ra.

    3.1.11 Chạy script build_mobi.jsee để tạo file AZW3. Nếu bạn muốn tạo file MOBI hoặc thay đổi độ nén của file eBook hãy mở file build_kindle.bat và đọc hướng dẫn trong đó trước khi làm.
    KindleGen.exe mất từ vài phút đến vài chục phút để tạo file eBook tùy theo truyện của bạn dài hay ngắn, nén nhiều hay ít. Khi bạn đang tập làm quen với bộ script thì không nên chọn độ nén cao vì sẽ mất nhiều thời gian. Lúc này bạn đang thử nghiệm coi bộ script chạy như thế nào, nếu phải đợi lâu sẽ rất ức chế. Tốt hơn cả là dùng mặc định (không nén).

    3.2 Cập Nhật Truyện
    Bạn làm các bước 3.1.4 đến 3.1.11 (giống như trường hợp trên nhưng bỏ qua việc tạo truyện mới). Điểm khác biệt ở đây là khi format và cập nhật truyện eBookWorm bắt đầu kiểm tra số chương của bạn có liên tục hay không.

    Ví dụ bạn đã làm truyện đến chương 700, truyện ra thêm được 250 chương, bạn lấy text về từ chương 703 đến 950. Khi bạn đưa text vào format (bước 3.1.9) eBookWorm sẽ báo text của bạn không liên tục với nội dung truyện đã có từ trước. Text của bạn phải bắt đầu từ chương 701 mới được coi là hợp lệ. Bạn có thể chọn dừng chương trình để bổ sung text thiếu hoặc mặc kệ cảnh báo và tiếp tục chạy chương trình.

    3.2 Export-Import
    3.2.1 Export
    Chạy script export_project.jsee. Text sẽ được export ra file tmp.html. Nếu không có lỗi gì bạn có thể copy vào file book_export.ebw. Text export ra có đầy đủ thông tin về truyện, có danh sách các quyển, các chương và nội dung.

    3.2.1 Import
    Để import trước hết bạn tạo ra một truyện mới bằng script create_new_ebook.jsee (bước 3.1.1), sau đó mở file book_export.ebw ra và copy text dùng để import vào đó. Bạn không cần phải điền bất cứ thông tin gì vào eBook.ebw. Chương trình sẽ tự điền vào khi import.

    Khi bạn coi book_export.ebw bằng EmEditor bạn sẽ thấy file bắt đầu bằng những thông tin về truyện như tên truyện, tên tác giả,... Bên dưới phần thông tin về truyện là đoạn hướng dẫn trước khi import. Phần này text có màu xanh lá cây.

    Bên dưới file chia thành các đoạn dài ngắn khác nhau, bắt đầu bằng dòng có chữ in hoa "BẮT ĐẦU ..." và kết thúc bằng dòng có chữ "KẾT THÚC ...". Đoạn quan trọng nhất là "IMPORT OPTIONS". Bạn làm theo hướng dẫn để lựa chọn các Import Options. Trong đa số trường hợp bạn giữ nguyên mọi thứ như truyện gốc.

    Chạy script import_project.jsee để import text. Chương trình sẽ mất vài phút để import mọi thứ.

    4. Điều Chỉnh Truyện
    Khá thường xuyên bạn phải điều chỉnh truyện, ví dụ như bạn lấy được phần giới thiệu tác phẩm và muốn thêm vào truyện, hay bạn thay đổi kiểu dáng của truyện. Hiện tại eBookWorm có 74 kiểu dáng khác nhau, bạn có thể chọn kiểu nào mình thích nhất. Hoặc khi bạn muốn thay hình bìa mặc định bằng hình bìa kiếm được,... Tất cả những trường hợp đó bạn đều cần điều chỉnh truyện.

    Script dùng để điều chỉnh truyện là add_remove_proj_files.jsee. Trong đa số các trường hợp bạn vào file thiết kế eBook.ebw và thay đổi các lựa chọn trong đó, sau đó chạy add_remove_proj_files.jsee để thực hiện thay đổi. Đừng quên chạy script, nếu không file thiết kế và truyện của bạn sẽ chênh nhau.

    4.1 Cập nhật nội dung các file không bắt buộc
    Các file không bắt buộc khi làm truyện là file giới thiệu truyện (introduction.html), file giới thiệu tác giả (biography.html), file phần mở đầu (prologue.html), file phần kết (epilogue.html), file lời cảm tạ (acknowledgement.html), file bảng chú thích (index.html).

    Các file không bắt buộc đều dùng format_optional_content.jsee để format nội dung, trừ index.html dùng với script import_index.jsee. Để cập nhật nội dung các file không bắt buộc bạn làm sạch text (chạy các bước 3.1.4 và 3.1.5), sau đó chạy script format_optional_content.jsee. Bạn thay nội dung cũ trong các file này bằng nội dung mới đã được format.

    4.2 Thêm - bớt các file không bắt buộc
    Ví dụ bạn muốn bỏ phần giới thiệu truyện mặc định của eBookWorm chẳng ăn nhập gì đến nội dung truyện, đợi đến khi kiếm được phần giới thiệu mới đưa trở lại vào truyện. Bạn vào file thiết kế eBook.ebw, tìm tùy chọn dành cho file giới thiệu truyện. Đó là EBWV_INTRODUCTION_FILE, nó được tô màu đỏ bắt mắt. Bạn bỏ nó khỏi truyện bằng cách gán cho nó giá trị "0", sau đó chạy script add_remove_proj_files.jsee.

    Sau này khi bạn kiếm được phần giới thiệu, trước hết cập nhật nội dung của introduction.html như hướng dẫn ở phần 4.1, sau đó vào eBook.ebw gán giá trị "1" cho EBWV_INTRODUCTION_FILE rồi chạy add_remove_proj_files.jsee.

    4.3 Cập nhật hình
    Bạn kiếm được hình cho truyện và muốn thay hình mặc định của eBookWorm. Bạn cần copy hình đè lên hình gốc trong folder custom_imgs, sau đó chạy script add_remove_proj_files.jsee.

    Chú ý: không được copy thẳng vào folder imgs. Hình trong imgs thường xuyên được cập nhật từ custom_imgs, nếu bạn copy hình vào imgs nó sẽ nhanh chóng bị hình cũ copy đè lên.

    4.4 Nhúng - không nhúng font chữ ngoài.
    Đa số kiểu dáng của eBookWorm sử dụng font ngoài, chỉ có 4 kiểu dáng đầu tiên dùng font của chương trình đọc eBook. Có 2 lựa chọn: bạn nhúng font chữ vào file eBook, trình đọc eBook sẽ lấy font bạn nhúng vào truyện để hiển thị nội dung. Lựa chọn thứ hai là không nhúng font vào truyện, khi đó trình đọc eBook sẽ kiếm font cài trên máy của bạn, nếu kiếm không thấy nó sẽ dùng font mặc định của trình đọc eBook. Để coi được eBook loại này bạn cần phải copy font vào phone / table. Bạn coi hướng dẫn ở topic Mẹo Vặt Làm Ebook, post #8

    Trong một số trường hợp coi bằng font copy vào phone/tablet đẹp hơn hẳn font nhúng vào truyện. Khi KindleGen tạo eBook có thể đã thay đổi font vì một lý do gì đó khiến cho nó không còn đẹp như lúc đầu nữa, có lẽ để eBook vẫn coi được khi đọc trên mấy cái máy đồ cổ, nhưng như vậy chất lượng hiển thị sẽ giảm xuống. Đồ nhái không thể bằng đồ "zin", đó là chân lý. :))

    Bạn vào eBook.ebw, tìm tùy chọn cho font nhúng (EBWV_ATTACH_EMBEDDED_FONTS), gán "1" để nhúng font, gán "0" để không nhúng, sau đó chạy script add_remove_proj_files.jsee.

    4.5 Thay đổi kiểu dáng
    Bạn chán kiểu dáng cũ, muốn thử cái mới coi như thế nào. Bạn chạy script change_ebook_style.jsee rồi nhập kiểu dáng mới vào khi được hỏi.

    Chú ý quan trọng: không được đổi kiểu dáng bằng cách vào eBook.ebw và sửa EBWV_STYLE_OPTION ! Ngoại lệ duy nhất là khi bạn làm một eBook mới toanh và lựa chọn kiểu dáng cho nó (bước 3.1.2). Một khi bạn đã khởi tạo truyện (bước 3.1.3) thì chỉ có thể thay đổi kiểu dáng bằng change_ebook_style.jsee.

    4.6 Khóa truyện đã hoàn thành
    Khi truyện đã hoàn thành, bạn nên khóa nó lại để tránh nội dung bị thay đổi do nhầm lẫn. Truyện bị khóa chỉ có thể tạo file AZW3 & MOBI, export, đổi kiểu dáng nhưng không thể format text hay cập nhật nội dung.

    Bạn vào file eBook.ebw và gán "3" cho EBWV_STATE. Không cần phải chạy bất kỳ script nào.

    Nếu vì một lý do nào đó bạn cần cập nhật nội dung cho truyện đã khóa thì bạn có thể mở khóa. Bạn vào file eBook.ebw và gán "2" cho EBWV_STATE. Không cần phải chạy bất kỳ script nào.

    PS: Nếu bạn lười không kiếm "đồ chơi" mà dùng các mẫu mặc định của eBookWorm, bạn có lý do rất thuyết phục cho sự lười biếng của mình: hình mặc định trông "mát" mắt hơn nhiều so với mấy cái hình hầm hố chém giết máu me. Enjoy!

    24-9-2015: Cập nhật hướng dẫn sử dụng (làm mới truyện)

    25-9-2015: Cập nhật hướng dẫn sử dụng (full)
     
    Chỉnh sửa cuối: 3/11/15
  3. Big Bang

    Big Bang Thành viên kích hoạt

    Được thích:
    130
    eBookWorm - Bộ Script Làm eBook Của Big Bang


    Q & A


    Bộ script theo chuẩn EPUB3, vậy eBook tôi làm ra có coi được bằng các chương trình đọc eBook hiện nay hay không?
    99% là được, 1% xui xẻo còn lại do trình đọc eBook quá cũ. Tôi cũng không biết liệu 1% ngoại lệ này có tồn tại hay không, bởi vì nếu bạn rơi vào trường hợp đó tôi cũng không rõ có phải bạn đang mở một chương trình coi eBook?
    Tuy eBookWorm theo chuẩn mới, nhưng những thứ nó xử lý lại xưa hơn trái đất: text, hình, chấm hết! Đó là những thứ mà bất kỳ chương trình đọc eBook nào cũng phải làm được, tuy chất lượng hiển thị có thể khác xa nhau.
    Chuẩn mới giúp eBook bạn làm tương thích tốt với những chương trình đọc eBook sau này, ngoài ra khi sắp tới đây các trình đọc eBook bắt đầu hỗ trợ rộng rãi video, nhạc, hình động hay những đồ multimedia sống động thì bộ script có thể được nâng cấp với công sức bỏ ra ít nhất.
    Điểm chính yếu là nếu nó nâng cấp, những eBook cũ bạn làm vẫn có thể chỉnh sửa ngon lành trên phiên bản mới vì thiết kế vẫn giữ cùng một nguyên tắc. Phiên bản mới chỉ thêm vào vài thứ bắt mắt trên một nền căn bản mà bất cứ eBook nào cũng phải có.

    Tại sao lại dùng lẫn lộn EmEditor và Notepad++? Chuyển đổi qua lại giữa hai chương trình khiến tôi dễ bị nhầm lẫn. Có thể chỉ dùng EmEditor hay Notepad++ không?
    Chỉ dùng Notepad++ chắc chắn là không được vì nó không hỗ trợ tính toán. Chỉ dùng EmEditor thì không nên vì nó dọn rác rất chậm.
    Bạn có thể hình dung tình huống tương tự như khi đi mua xe.
    Người bán xe khoe khoang đủ thứ về xe của mình: giá cả hợp lý, kiểu dáng thời trang, thiết kế sang trọng tiện nghi, xe bền và an toàn lại tiết kiệm xăng. Nói tóm lại là đúng thứ bạn cần. Bạn sẽ không thể tìm thấy chiếc thứ hai phù hợp hơn với mình.
    Anh ta không bao giờ nói với bạn những câu như thế này:
    - Xe tôi bán có mấy cái bánh xe hình tròn. Ông sẽ phải đổ xăng cho nó. Xăng dùng để chạy động cơ đốt trong.
    Giả sử bạn nghe thấy người bán xe nói như thế, có lẽ bạn sẽ tránh xa ông ta một chút và hỏi:
    - Ông đang bán cái gì vậy?
    Người bán xe không nói sai về chiếc xe của mình, sai ở chỗ ông ta nói ra điều đó.
    Tương tự như vậy, khi làm eBook có nhiều thứ độc giả sẽ không bao giờ hỏi bạn. Nếu sách bạn không có hay không có đủ, họ sẽ hỏi:
    - Ông gọi cái này là một quyển sách chất lượng thương phẩm?
    Một số quy tắc cần phải tuân thủ khi làm sách, cho dù in hay điện tử, đó là những quy tắc về dấu chấm câu, xuống hàng, thống nhất một kiểu bỏ dấu tiếng Việt từ đầu đến cuối, viết hoa tựa chương,... Truyện dài làm eBook thường do nhiều người dịch, có nhiều lúc không chuẩn hay dùng không nhất quán, đôi lúc dùng cả dấu chấm câu tiếng Hoa. Những thứ đó đều cần chỉnh lại trước khi đến tay độc giả.
    Công việc dọn rác là bắt buộc, nhưng Notepad++ làm tốt hơn hẳn EmEditor. Một truyện hơn 1000 chương dọn rác bằng Notepad++ chỉ mất 5-6 phút nhưng EmEditor chạy ì ạch một giờ đồng hồ chưa xong. Tôi có viết phần dọn rác cho EmEditor, bạn có thể thử dùng nếu bạn có đủ kiên nhẫn.

    Tại sao mỗi script của eBookWorm lại chạy trên những file khác nhau? Như vậy khá rắc rối và khó nhớ.
    Có 2 lý do để làm như vậy.
    Thứ nhất, ngôn ngữ script rất chậm (eBookWorm viết trên JavaScript), nó chậm hơn nhiều so với file EXE, kiểm tra coi text có vấn đề gì không rất chậm và kém hiệu quả. Vì vậy bộ script không hề kiểm tra gì cả trừ đọc tên file đích coi có đúng hay không! Text của bạn trải qua các khâu từ đầu đến cuối sẽ được rải ra nhiều file khác nhau. Bộ script coi việc bạn chạy một script nào đó trên đúng file có nghĩa là bạn đã chọn đúng script để chạy vào đúng thời điểm. Nếu tất cả script chỉ chạy trên 1 file duy nhất, ví dụ như file src_txt.html, khi bạn lỡ click nhầm script thì kết quả sẽ rất khó đoán, khả năng rất lớn là truyện của bạn sẽ hỏng bét. Khi mỗi script đều chạy trên những file khác nhau và bạn bấm nhầm script, khả năng lớn nhất là bạn sẽ trông thấy một cái thông báo thay vì phải làm lại truyện từ đầu.

    Thứ hai, nếu trước khi chạy script bạn có thời gian liếc qua nội dung của file một cái thì sẽ đỡ nhầm lẫn hơn rất nhiều. Vì vậy các script đa số đều chạy trên file đích có liên quan nhiều nhất đến công việc của mình, ngay cả khi nó chỉ đọc thông tin trong đó để thay đổi những file khác.

    eBookWorm có một đống kiểu dáng (mấy chục loại) nhưng chúng trông quá giống nhau, rất khó phân biệt. Tại sao không gom vào một vài kiểu cho dễ nhớ?
    Các kiểu dáng số lượng tuy nhiều nhưng thật ra chỉ dựa trên 2 cách sắp đặt:
    (a) tựa chương và số chương không tách rời, canh lề trái. Ví dụ:
    Chương 100: Tẩu Thoát

    và (b) tựa chương và số chương tách rời thành 2 dòng, canh giữa trang
    Chương 100
    Tẩu Thoát

    Trên sách in chỉ có 2 cách sắp xếp như trên, thêm một kiểu sắp xếp canh lề phải nữa. Trên ebook nếu canh lề phải nhiều khi tựa chương dài bị ngắt thành 2 dòng trông rất xấu vì tiếng Việt đọc từ trái sang phải chứ không đọc từ phải sang trái như tiếng Arab. Vì vậy tôi chỉ giữ lại 2 kiểu sắp xếp nói trên.

    Tất cả các kiểu dáng đều dựa trên 2 cách sắp xếp cơ bản này, thay đổi chỉ là cỡ chữ lớn nhỏ, màu sắc khác nhau, font chữ khác nhau, v.v.

    Nhưng sự khác biệt của những thứ "lặt vặt" đó rất lớn. Ví dụ nếu bạn chọn một font chữ xấu và khó đọc trên phone/tablet, khi đó thì cả cuốn truyện của bạn sẽ trông rất tệ. Điều này tương tự như xây nhà đều dựa trên các nguyên tắc cơ bản: dưới có nền, trên có tường, trên cùng có mái nhà. Nhưng nhà đẹp nhà xấu thì muôn hình vạn trạng tùy thuộc vào nước sơn, kiểu cọ, màu ngói,... và những cái đó chẳng "lặt vặt" chút nào.

    Nếu bạn biết HTML & CSS, bạn có thể tinh chỉnh mọi thứ theo ý mình. Nếu bạn không biết mấy cái đó là gì, vậy thì chỉnh sửa màu sắc cỡ chữ gần như là điệp vụ bất khả thi, khỏi nói đến tinh chỉnh.

    eBookWorm cung cấp nhiều kiểu dáng để những bạn không biết HTML & CSS vẫn có thể lựa chọn được kiểu hợp gu nhất. Rất nhiều kiểu dáng chỉ khác nhau một chút xíu, bạn nên lấy một ít text của truyện chia thành nhiều quyển làm eBook để thử các kiểu dáng. Nhớ chỉ dùng một ít text thôi để làm cho nhanh. Thường thì mỗi người chỉ chọn từ trong đó ra 1-2 kiểu hợp gu. Sau khi chọn xong bạn có thể lên forum hỏi cách tinh chỉnh những kiểu dáng đó.

    Tôi là người theo chủ nghĩa đơn giản. Tôi thấy eBook làm bằng eBookWorm có quá nhiều thứ rườm rà không cần thiết như giới thiệu tác giả, trang index.html hay một đống hình chẳng hề ăn nhập gì với nội dung truyện. Nó làm eBook trở nên nặng nề, load và sang trang rất chậm. Có cách nào bỏ chúng đi không?
    Như đã nói ở trong phần hướng dẫn sử dụng, eBookWorm chỉ giúp bạn làm eBook nhanh và chính xác chứ không giúp bạn thu thập những thứ cần để làm eBook. Vì vậy bạn phải đi kiếm đồ phù hợp để thay cho những thứ mặc định eBookWorm cung cấp.

    eBook load nhanh hay chậm, mượt hay giật phụ thuộc nhiều vào loại eBook, ebook reader và cả phone/tablet đang dùng. Bạn có thể dễ dàng thử. File HTML do eBookWorm tạo ra có thể dùng để làm tất cả các loại eBook phổ biến hiện nay: kindle, epub, pdf,... Nhưng bạn sẽ nhanh chóng nhận ra, kindle ebook ăn đứt đối thủ. Điều đó giải thích tại sao Kindle Reader trên Google Store vượt mốc 100 triệu từ lâu, các đối thủ khác nếu không ép mua ép bán như Google Book thì số lần tải không theo kịp số lẻ của nó. Tại sao cùng theo chuẩn chung làm eBook và dùng những file HTML giống nhau, kindle ebook lại đẹp và mượt hơn? Tại sao cùng đi siêu thị như nhau nhưng cơm nhà hàng xóm lại ngon hơn cơm nhà bạn? Bạn nên đợi lúc ông hàng xóm vắng nhà để tâm sự với cô vợ trẻ.

    Về câu hỏi về nhiều thứ rườm rà, bạn hình dung tình huống tương tự trong siêu thị:
    Có rất nhiều người đến siêu thị mỗi ngày, nhưng mỗi người cần những thứ khác nhau và chẳng ai hoàn toàn hài lòng về siêu thị. Ít nhất họ cho rằng mình có thể mua được đồ tốt hơn mà chỉ cần trả ít tiền hơn, mặc kệ đồ trong siêu thị có tốt và rẻ cỡ nào. :))
    Chủ siêu thị không thể chiều lòng tất cả mọi người, vì vậy ông ta tìm cách làm cho nhiều người nhất cảm thấy hài lòng hoặc ít nhất họ cũng cảm thấy chấp nhận được. Bạn thấy mỗi siêu thị mỗi khác nhưng vẫn có những nét chung mà chúng ta hay gọi là sắp đặt "kiểu siêu thị".

    Sách in hay điện tử cũng vậy, có rất nhiều độc giả nhưng chẳng ai hoàn toàn hài lòng. Vì vậy các nhà xuất bản mới tổng kết kinh nghiệm hàng trăm năm để lập ra những kiểu mẫu chung như hình bìa, trang bìa lót, trang giới thiệu tác giả, mục lục,... Nếu bạn chỉ muốn đọc nội dung, vậy thì lật thẳng đến chương 1. Nếu bạn muốn tìm hiểu thêm, bạn có thể lục lọi những trang khác. Và người nào cũng vậy, giống hệt như khách hàng trong siêu thị, đều cho rằng mình chỉ cần trả ít tiền hơn nếu sách không có thêm những trang thừa mà mình chẳng bao giờ đọc! Và nhà xuất bản cũng vậy, họ ước gì có thể biết mỗi độc giả thích cái gì để in sách theo đúng yêu cầu và tiết kiệm được một đống tiền vì không in thừa. Đáng tiếc là cho đến bây giờ đó vẫn chỉ là mơ ước.

    Có một điểm khác nhau nhỏ ở đây: bạn là người làm eBook. Bạn giống như nhà xuất bản hoặc ông chủ siêu thị chứ không phải là khách hàng, vì vậy bạn có quyền nhào nặn eBook của mình tùy thích cho dù nó có khác người đến mức nào đi nữa. Bạn không thể bảo đảm eBook mình làm sẽ được nhiều người thích, nhưng bạn lại có toàn quyền quyết định eBook của mình trông như thế nào.

    Vì vậy, câu trả lời cho câu hỏi có thể bỏ bớt những đồ "lỉnh kỉnh" đi hay không là . Và điều đó cũng không khó chút nào. Bạn coi cách làm chi tiết ở câu hỏi đáp về làm eBook tối thiểu.

    PS: một lý do quan trọng nữa (đối với riêng tôi) là lập trình những thứ "rườm rà" đó dễ hơn nhiều so với "đơn giản". Nghe thì có vẻ tức cười nhưng đúng là như vậy. Máy tính và chương trình cho máy tính rất cứng nhắc và ngu ngốc. Những chương trình trí tuệ nhân tạo (Artificial Intelligence - AI) xịn như Google Now hay Siri chỉ có cỡ đại gia như Google hay Apple mới kham nổi. Chương trình bình thường xử lý text giống như "máy" vậy, nó không hiểu nội dung như AI. eBookWorm thì khỏi nói, nó còn không được coi là một chương trình bình thường. Lập trình những thứ rõ ràng như thiết kế chuẩn của eBook còn được, chứ thiết kế "đơn giản" kiểu năm người mười ý thì bó tay. Cho dù tôi có lập trình được 1/10 yêu cầu "đơn giản" đi nữa thì số lượng code sẽ phình ra bao nhiêu so với bộ script hiện tại? Gấp 3 lần hay hơn thế? Lúc đó tốc độ sẽ chậm hơn bao nhiêu lần? Ebook làm ra không theo chuẩn sẽ được bao nhiên phần trăm chấp nhận so với ebook theo chuẩn? Tôi không có câu trả lời và cũng không dám thử.

    Phone của tôi chỉ hỗ trợ đọc truyện bằng Java. Tôi rất muốn làm những eBook tối thiểu, chỉ có mục lục và nội dung, không cần trang bìa hay hình. Có cách nào để làm những eBook như vậy bằng eBookWorm hay không? Nếu có, sau này khi tôi đổi phone (nó có thể là Android, iPhone hay Windows phone / tablet) thì những eBook tối thiểu đó có thể chuyển lại thành các eBook đầy đủ tính năng hay không?
    Có thể, và cũng không khó làm.

    Tuy nhiên, tôi cần nhấn mạnh là eBook tối thiểu đi ngược lại những nguyên tắc làm eBook nói chung và của eBookWorm nói riêng và không được khuyến khích. Nói ngắn gọn, bạn "đánh lừa" eBookWorm để đạt được mục đích của mình. Không có gì bảo đảm cho các file HTML và eBook của bạn khi bỏ qua những thứ quan trọng khi làm ebook. Cách làm dưới đây chỉ là bước đầu để bạn tự tìm hiểu, bạn sẽ phải tự tìm tòi tiếp mà không có sự hướng dẫn của tôi. Ít nhất là đối với version hiện tại (1.2) tôi nhìn thấy khả năng làm như vậy, nhưng không có gì chắc chắn khi eBookWorm được nâng cấp sau này.

    Mấu chốt để làm là file eBook.opf, bạn mở nó lên bằng Notepad++ và chọn menu Language --> XML để highlight cho dễ đọc.

    [​IMG]
    Hình 1​

    (Hướng dẫn sau đây dành cho những bạn không biết HTML/XML. Bạn nào biết thì bỏ qua.)
    Bạn sẽ thấy có những dòng bắt đầu bằng <item id=" bị kẹp giữa 2 dòng có EBWC_BEGIN...EBWC_END... màu xanh lá cây. Có dòng được tô màu xanh giống như EBWC_BEGIN...EBWC_END..., ví dụ <item id="acknowledgement"... như trong hình 1, cũng có dòng được tô đủ màu khác nhau như <item id="table_of_contents".... Những dòng được tô đủ màu là những dòng được bật (enabled), những dòng có màu xanh là những dòng bị tắt (disabled), trong đó EBWC_BEGIN...EBWC_END... đóng vai trò như một cái công tắc. Cách bật tắt công tắc như trong Hình 1: có mấy "đồ chơi" ở trong vòng tròn được đánh dấu là bật, không có là tắt.

    Một dòng bắt đầu bằng <item id=" thường có một dòng bắt đầu bằng <itemref idref=" tương ứng ở phía dưới tạo thành một cặp, ví dụ <item id="table_of_contents"...<itemref idref="table_of_contents".... Hai dòng này tương ứng với file table_of_contents.html. Cũng có khi chỉ có dòng <item id=" như trường hợp của hình bìa (cover image).

    Nguyên tắc để đưa một file vào eBook hay loại nó ra là bật hoặc tắt công tắc tương ứng. Ví dụ để loại table_of_contents.html bạn cần tắt 2 công tắt, để loại hình bìa cần tắt 1 công tắc. Và điều này áp dụng cho tất cả các file dùng để làm eBook, mặc kệ có phải là file bắt buộc hay không.

    eBook tối thiểu chỉ cần giữ lại 2 file eBook.cssbook_contents.html là đủ.

    Sau này muốn khôi phục để làm eBook theo chuẩn bạn chỉ cần bật lại các công tắc là xong.

    Bạn cũng có thể chọn giải pháp ít triệt để hơn. Không phải tất cả các file đó đều là bắt buộc. Bạn coi phần 2.2.1 và 4.2 Hướng Dẫn Sử Dụng (post #2) để biết cách bỏ những file không bắt buộc.

    Bạn cũng có thể chọn các kiểu dáng của eBook ít dùng đến hình. Ví dụ các kiểu dáng đầu tiên và thứ ba của mỗi font chữ chính không dùng hình bìa cho các quyển đối với truyện chia thành quyển. Coi chi tiết về các kiểu dáng trong file eBook.ebw.

    Dùng font nhúng cũng khiến cho eBook "tăng cân". Các kiểu dáng từ #1 đến #4 chỉ dùng font có sẵn trong phone/tablet. Coi chi tiết về font nhúng trong file eBook.ebw.

    Đối với những file bắt buộc, bạn có thể bỏ hình nếu muốn. Ví dụ trang bìa front_cover.html bạn bỏ dòng code có hình bìa (dòng đó có tên file *.JPG của trang bìa front_cover.jpg). Như vậy cho dù eBookWorm có xào nấu hình bìa cỡ nào đi nữa, nó cũng không bao giờ xuất hiện trong eBook của bạn.

    Lưu ý cuối cùng, nếu bạn áp dụng những điều trên cho một truyện cụ thể, các truyện khác sẽ không bị ảnh hưởng. Nếu bạn áp dụng cho các file trong folder eBookWorm\template, vậy thì từ nay trở đi tất cả eBook của bạn làm sẽ là eBook tối thiểu.

    Tôi lấy text sạch ở những truyện cũ tôi đã làm để làm lại eBook bằng eBookWorm thì thỉnh thoảng bị lỗi (mất tựa chương, mất dòng nội dung, đánh số quyển không đúng...) Tôi phải làm sao?
    Script format_text.jsee có một số yêu cầu đối với text như sau:
    - Có một dòng trống ở đầu và cuối text (rất quan trọng)
    - Tựa chương chuẩn: đánh số chương bằng số (bằng chữ như vietphrase không dùng được), sau số chương phải có dấu hai chấm.
    - Không có các dấu <>
    - Không có dòng trống trừ ở đầu và cuối text; không có khoảng trắng, tab ở đầu và cuối dòng​

    Nếu text không đáp ứng yêu cầu sẽ rất dễ xảy ra các lỗi nói trên. Macro Làm Sạch Text của Notepad++ vừa làm sạch text, vừa kiểm tra và tìm cách sửa lỗi để text có thể đưa vào format. Text sau khi làm sạch chỉ nên sửa lỗi chính tả, xóa text rác còn sót, sửa lại tựa chương bị lỗi, ví dụ tựa chương bị thiếu dấu hai chấm do lỗi text nguồn:

    Chương 5 Đào Tẩu

    Text không lỗi phải như thế này:

    Chương 5: Đào Tẩu

    Rất nhiều khâu kiểm tra dựa trên text của 1 dòng ở vị trí xác định, do đó text để format chỉ cần thừa hoặc thiếu một dòng thì kết quả rất có thể sẽ khác hẳn. Vì vậy text cần được làm sạch trước khi format.

    Nếu bạn lấy text sạch từ nơi khác không qua làm sạch bằng macro Làm Sạch Text bạn phải kiểm tra các điều kiện trước khi chạy format_text.jsee. Nếu bạn không chắc chắn lắm thì có thể chạy lại Làm Sạch Text cho chắc ăn.

    Text đưa vào format phải được đưa vào 2 file: src_txt.html chứa nội dung và tmp.html chứa danh sách các chương. Nội dung và danh sách chương phải khớp với nhau. Ví dụ nếu trong danh sách chương có chương 100 nhưng nội dung lại không có, khi chạy kindlegen.exe sẽ báo lỗi và không tạo ra eBook.

    Cách làm tốt nhất là bạn copy text sạch vào file src_txt.html, thêm một dòng trống vào đầu và cuối file nếu chưa có, sau đó bắt đầu làm từ bước 3.1.6 Chạy script capitalize_collect_titles.jsee.

    Tại sao thỉnh thoảng macro Làm Sạch Text lại xóa trắng vài chương truyện?
    Những chương bị xóa trắng đó bị mất (một phần) nội dung hoặc chỉ toàn file ảnh.

    Một chương được coi là có nội dung đầy đủ nếu nó có nhiều hơn 15 dòng sau khi đã xóa text rác. Nếu nó chỉ có 15 dòng trở xuống thì sẽ bị xóa sạch. Những chương bị lỗi không xuống dòng (cả chương chỉ có 1 dòng dài 10km) chắc chắn ở trong diện bị giải tỏa trắng! Sau này khi bạn chạy script gen_merge_list.jsee để kiểm tra số chương bạn sẽ dễ dàng phát hiện ra các chương bị thiếu và sửa lỗi. Nếu Notepad++ không xóa chương lỗi bạn sẽ rất khó phát hiện ra chúng trong một truyện có vài trăm chương trở lên.

    Thường xuyên xảy ra trường hợp chương bị trùng tựa: tựa chương có ở trong lẫn ngoài spoiler. Khi đó ở giữa hai tựa chương bị trùng có một đống text rác nhưng thường là ít hơn 15 dòng sau khi đã xóa sơ bộ một số rác. Làm Sạch Text sẽ xóa bớt một tựa chương và tất cả text rác ở giữa chúng và sau này bạn không cần phải sửa lại bằng tay rất mất công.

    Chú ý: áp dụng với eBookWorm 1.1 trở lên.

    Truyện tôi làm có một số chương toàn file ảnh. Macro Làm Sạch Text xóa trắng những chương này. Tôi phải làm sao để giữ chúng?
    Nếu text của bạn được làm sạch bằng các tool làm eBook khác, bạn có thể dùng mà không cần phải chạy Làm Sạch Text. Bạn coi phần trả lời ở câu hỏi làm eBook từ text sạch lấy từ nguồn khác.

    Nếu text của bạn copy từ trang web hoặc lấy về bằng các tool bạn phải thêm bằng tay các chương có file ảnh sau khi làm sạch text. Các chương bạn thêm vào phải có ít nhất một dòng nội dung (bạn không được để một chương chỉ có tựa mà không có nội dung), thí dụ:

    Chương 100: Dũng Mãnh
    Nội dung chương 100 đang chờ đả tự, sẽ cập nhật sau.


    Sau khi thêm vào các chương bị thiếu bạn không được chạy macro Làm Sạch Text lần nữa, nếu không nó lại bị xóa. Text chỉ cần làm sạch một lần, bạn không cần phải chạy đi chạy lại Làm Sạch Text. Các macro sửa lỗi chính tả thì có thể chạy nhiều lần không sao cả.

    Nói chung, bạn không nên làm eBook những truyện có quá nhiều chương file ảnh. Nếu chỉ vài chương thì không có vấn đề, nếu là vài chục chương trở lên thì không nên. Khi đó độc giả sẽ phải liên tục chuyển qua browser để coi chương có file ảnh trên mạng, rất mất hứng. Nếu vẫn muốn làm eBook cho những truyện như vậy, bạn có thể tham khảo mẹo làm eBook loại này ở post #xxx topic này.

    Sau khi nâng cấp eBookWorm lên bản 1.1 khi build truyện bằng build_mobi.jsee tôi thường gặp cảnh báo trong file eBook_KindleGen_Report.txt. Điều đó có ảnh hưởng gì đến chất lượng eBook hay không?
    Điều đó còn tùy vào loại cảnh báo (warning) bạn gặp phải.

    Có cảnh báo trong trường hợp kindlegen.exe cho rằng có điều gì đó lệch chuẩn trong các file bạn dùng để làm eBook. Trước đây ở phiên bản 1.0 eBookWorm bỏ qua mọi cảnh báo và bạn thấy mọi việc nói chung vẫn ổn. Điều này nghe giống như lập luận của mấy tay chạy xe ẩu: “Bà con chửi chẳng nhằm nhò gì, bị công an tuýt còi mới ngán!” Tuy nhiên, giống dzậy nhưng hổng phải dzậy!

    Có cảnh báo là đúng, ví dụ như hình bìa có kích thước quá nhỏ làm ảnh hưởng đến chất lượng eBook (thương phẩm). Tuy nhiên tôi thường xuyên gặp cảnh báo Error(core):E1003: Unknown error in class String mà chẳng hiểu nó là cái gì và cũng không thấy có ảnh hưởng gì đến chất lượng truyện. Danh sách những cảnh báo chính xác và ngớ ngẩn khá dài và có trời mới biết đó là lỗi của ai.

    eBookWorm dùng kindlegen.exe mới nhất (version 2.9). Amazon nâng cấp lên bản 2.9 vào tháng 10/2014. Kindle eBooks coi trên Android phone/tablet chủ yếu dựa trên Android System WebView của hệ điều hành Android. Từ tháng 10/2014 đến nay - tháng 11/2015 - Android System WebView đã được nâng cấp không biết bao nhiêu lần rồi nhưng kindlegen.exe vẫn thế. Có một số cảnh báo nói rằng có một số thứ không hiển thị được trên các Kindle Reader làm tôi hết hồn, nhưng sau khi kiểm tra lại thì nó vẫn chạy ngon lành. Những lúc như vậy kindlegen.exe giống như một bà già lẩm cẩm thường xuyên ca cẩm cô cháu gái, nếu nó không chịu bớt ăn quà vặt đi thì sẽ không đi lọt cửa nhà chồng. Bà cụ không hề nhớ là chồng nó đã tậu nhà lầu từ lâu rồi, cô cháu gái của cụ phải nặng hơn một con voi Ma mút mới không đi lọt cửa!

    Trong file eBook_KindleGen_Report.txt bạn tìm từ Error để dò lỗi, Warning để dò cảnh báo.

    - Lỗi (Error): mức độ nặng như mất file, link hỏng,... thường khiến cho kindlegen.exe không tạo ra được file MOBI
    - Cảnh báo (Warning): mức độ từ thấp đến trung bình như hình nhỏ, mất một số HTML tag,... có ảnh hưởng tùy trường hợp. Nhiều nhất chỉ ảnh hưởng đến chất lượng ebook (thương phẩm) nhưng vẫn tạo ra eBook.

    Thiết kế mẫu của trang bìa trước (front_cover.html), trang bìa lót (front_matters.html) và trang bìa sau (back_cover.html) là cố định? Tôi chỉ có thể thay hình mặc định bằng hình của truyện, nhưng kích thước của hình thay đổi tùy theo truyện và nhiều khi làm xộc xệch cả trang. Tôi có thể thay đổi thiết kế được không?
    Trong các file đó có hướng dẫn (nếu coi bằng Notepad++ sẽ có màu xanh lá) bạn thay đổi một số thứ, ví dụ thay đổi cỡ chữ và màu sắc của tên truyện, tên tác giả,... hoặc khiến cho tên truyện chìm vào hình như ở sách in. Bạn thử điều chỉnh cho phù hợp với từng truyện.

    Trong file back_cover.html bạn nên thay những dòng tên truyện mặc định có sẵn (Truyện 1,Truyện 2,Truyện 3) bằng tên truyện thật của tác giả.

    Nếu bạn muốn thay đổi thêm, ví dụ thay đổi thiết kế, bạn phải tự viết code HTML. Lên forum hỏi nếu bạn không chắc chắn lắm.

    Chú ý: không phải lúc nào những điều chỉnh đó cũng có hiệu quả. Điều đó có thể tùy thuộc vào loại eBook bạn làm (kindle, epub, pdf,...) và chương trình ebook reader bạn đang dùng. Nói chung bạn phải thử cho trường hợp cụ thể của mình.

    Tôi xóa text rác bằng macro Làm Sạch Text của Notepad++ . Sau hơn 20 phút chạy macro bộ text nguồn 50MB của tôi chỉ còn đúng một chữ Ùy !!! Chuyện gì xảy ra vậy?
    Text 50MB là quá lớn với Notepad++. Không bao giờ dùng Notepad++ để mở file lớn hơn 25MB. Nếu file lớn hơn phải chia nhỏ ra làm sạch nhiều lần.
    Notepad++ chạy rất nhanh, còn EmEditor mở file 15GB cũng chẳng có vấn đề gì. Notepad++ là một chiếc xe đua, EmEditor là xe tải hạng nặng. Không có loại xe nào vừa chạy nhanh như xe đua lại vừa thồ nặng như xe tải.
    Tôi biết xài cả Notepad++ với EmEditor để làm truyện là bất tiện, nhưng tôi vẫn muốn làm được những truyện cỡ 1k5 chương một cách nhanh chóng! Vì vậy đành phải chia cho Notepad++ và EmEditor phần việc phù hợp với chúng.
    Nếu truyện của bạn quá lớn cần chia nhỏ text để làm sạch với Notepad++, nhớ dùng cái "xe thồ" EmEditor để hoàn thành công việc.

    11-12-2015: Cập nhật Hỏi & đáp
     
    Chỉnh sửa cuối: 11/12/15
    babylong10, Chpn, airplane92 and 6 others like this.
  4. Big Bang

    Big Bang Thành viên kích hoạt

    Được thích:
    130
    eBookWorm - Bộ Script Làm eBook Của Big Bang


    Mẹo Làm eBook


    Post #4 này tập hợp các link đến các bài viết hỗ trợ làm eBook bằng bộ script eBookWorm. Các mẹo làm eBook bằng các bộ script khác hoặc các thủ thuật nói chung có thể tham khảo ở:

    Các vấn đề kỹ thuật + Share mấy thứ đồ chơi (Macro, Form ...) cho aE làm eBook

    Mẹo Vặt Làm Ebook

    Danh Sách Các Mẹo Làm eBook Bằng eBookWorm:
    1. Chương Gộp Bị Ngắt Giữa Chừng, post #33
    Chương gộp bị ngắt giữa chừng do đang dịch dở chừng. Ví dụ truyện ra đến Chương 635: Quật Khởi (Thượng) thì hết, sau này mới ra Chương 636: Quật Khởi (Hạ). Làm sao để gộp chương?
    2. Chương không có tựa được thay bằng Vô Đề, post #169
    eBookWorm tự động thêm tựa chương Vô Đề cho những chương không có tựa (vì bị coi là lỗi, sau này tìm được tựa chương sẽ thay vào). Một số truyện có rất nhiều chương không có tựa do chủ ý của tác giả. Nếu để Vô Đề thì không được vì không đúng với nội dung truyện, nếu xóa đi thì format sai, mục lục sai, không đổi kiểu dáng được,...

    26-11-2015: Cập nhật Mẹo Làm eBook
     
    Chỉnh sửa cuối: 26/11/15
  5. Big Bang

    Big Bang Thành viên kích hoạt

    Được thích:
    130
    eBookWorm - Mẹo Làm eBook

    Chương Gộp Bị Ngắt Giữa Chừng

    Mô Tả:
    Chương gộp bị ngắt giữa chừng do đang dịch dở chừng. Ví dụ truyện ra đến Chương 635: Quật Khởi (Thượng) thì hết, sau này mới ra Chương 636: Quật Khởi (Hạ). Làm sao để gộp chương?

    Cách Làm:
    eBookWorm cho cho phép cập nhật truyện từ text không bắt đầu bằng tựa chương cho trường hợp chương gộp.

    Hầu hết các trường hợp bạn làm ebook (làm mới hay cập nhật) đều bắt đầu từ một chương nguyên vẹn, có nghĩa là dòng đầu tiên trong text của bạn là một dòng tựa chương, ví dụ:

    Chương 100: Tẩu Thoát

    Chỉ khi bạn gộp chương và text bị gián đoạn ở giữa chương gộp như trong thí dụ thì text của bạn mới bắt đầu bằng một dòng nội dung bình thường thay vì tựa chương.

    Trong trường hợp đó, bạn sửa tựa chương Chương 635: Quật Khởi (Thượng) thành Chương 635-636: Quật Khởi, có nghĩa là gộp chương trước khi có phần hạ. Sau này khi truyện ra chương Chương 636: Quật Khởi (Hạ) bạn bỏ tựa chương 636 đi trước khi format text.

    Chú ý: xóa nguyên dòng tựa chương 636, không được để lại dòng trống và cũng không được xóa dòng trống đã có sẵn ở đầu text nguồn.

    Trong trường hợp các phần đánh số bằng số và bạn không biết tiếp theo có bao nhiêu phần, ví dụ Chương 635: Quật Khởi (1) thì tốt hơn cả là bạn cứ làm ebook bình thường, sau này khi cập nhật truyện bạn export ebook, chỉ lấy text sạch rồi gộp với text mới để làm ebook.

    Nếu bạn biết HTML, bạn có thể cứ format và update truyện bình thường, sau đó sửa trực tiếp HTML source cho nhanh.
    Nếu bạn không biết HTML, bạn có thể thử:
    - Để nguyên tựa Chương 635: Quật Khởi (1) (không sửa) khi làm ebook
    - Khi cập nhật vẫn gộp các chương khác bình thường, riêng đối với Chương 636: Quật Khởi (2) không xóa tựa chương trước khi format.
    - Sau khi update truyện, bạn so sánh HTML source trong 3 file book_contents.html, table_of_contents.html và epub_nav_doc.html với truyện bạn export text ra để gộp chương như hướng dẫn ở phần trước. Bạn sẽ thấy sửa HTML source cũng không khó khăn như người ta vẫn nói.
     
    Last edited by a moderator: 17/12/15
    airplane92, thieunt and Hải Xồm like this.

Thành viên đang xem bài viết (Users: 0, Guests: 0)