Tool_Script Tool LeechText Của Một Số Web Truyện

  1. ﻲA Bư✯

    ﻲA Bư✯ ››Thiếu nhiều thứ lắm™ Đại Boss

    Tham gia ngày:
    2/10/11
    Bài viết:
    6,334
    Được thích:
    12,514
    có phần mềm nào tạo epub cho dung lượng nhẹ không các bạn, dùng tool darkrai hơn 3k chương thì nặng quá
     
  2. Decepticon

    Decepticon Thành viên kích hoạt

    Tham gia ngày:
    24/4/13
    Bài viết:
    950
    Được thích:
    266
    get forum chất lượng tốt hơn chứ, mấy trang portal toàn chạy tool auto nên cứ 1 thằng lỗi là cả làng lỗi. ngoài ra truyện cv bên tangthuvien, bachngocsach, lachongthuvien.. cũng rất nhiều người đọc, chỉ cần clean được đống spoiler HV, Hanviet, Hán Việt, TT, Trung, Tiengtrung...là người ta get ầm ầm.
     
    Hải Xồm and ﻲA Bư✯ like this.
  3. Darkrai9x

    Darkrai9x Thành viên kích hoạt

    Tham gia ngày:
    1/12/15
    Bài viết:
    396
    Được thích:
    246
    Tool build dạng tách chương nên hơi nặng, nhưng ko tách ra mấy cái reader đọc lại lag, thôi thì chịu nặng tí cũng chả sao, bộ nhớ nay rẻ mà
     
    ﻲA Bư✯ thích bài này.
  4. Decepticon

    Decepticon Thành viên kích hoạt

    Tham gia ngày:
    24/4/13
    Bài viết:
    950
    Được thích:
    266
    Động toàn dân IT mà chả ai có hứng cải tiến QT nhể, việc nhẹ ko lương công đức vô lượng a :oni4:

    + Official QuickTranslator thread: http://www.tangthuvien.vn/forum/showthread.php?t=30151
    + Source code lượm nhặt https://secufiles.com/d6NR/Source_code_QT.zip

    1. Dữ liệu vp quá lộn xộn nhiều rác, gần như ko thể khai thác sức mạnh cộng đồng. Dữ liệu người này merge với người kia sẽ thành một mớ hổ lốn đầy rác.
    Fix:
    thêm tùy chọn Danh từ, Động từ, Tình từ, tùy chọn này chỉ xuát hiện khi update Vietphrase2. Ví dụ trong ảnh, 手机=smarthphone sẽ được thêm vào vietphrase2.txt và danhtu.txt.

    Dữ liệu danhtu.txt, dongtu.txt, tinhtu.txt có tác dụng chia sẻ cộng đồng và rút gọn triệt để vietphrase.txt (lý do nêu ở mục 2). Như vậy sẽ tránh được tình trạng phát sinh rác do 80% người dùng QT biết tiếng Việt. Tất nhiên sẽ cần một công cụ nhỏ na ná QuickVietPhraseMerger để merge dữ liệu.

    [​IMG]


    2. QT có một tính năng siêu đột phá là Luatnhan nhưng nó chưa được tối ưu triệt để, việc chạy luatnhan với vietphrase còn rất chậm, cực kỳ chậm.
    Fix:
    Luatnhan cần một thuật toán nhân với nhân {0} gồm Vietphrase, Danhtu, Names và Names2. Những từ, cụm từ không có khả năng làm nhân sẽ ném vào Vietphrase2.txt để giảm tải dữ liệu phải xử lý. Trong tương lai có thể bổ xung nhân {1}, {2}... tương ứng cho động từ, tính từ.

    Ngoài ra còn cần Luật nhân chấp nhận dấu câu .,? cùng ký tự đại diện đầu dòng ^, cuối dòng $
    Mã:
    ^{0}的手里=Trong tay {0}
    . {0}的手里=. Trong tay {0}
    , {0}的手里=, trong tay {0}

    3. Dịch trực tiếp trên QT chưa tốt
    Fix:
    - thêm tính năng auto scroll, tức là 1 ô nào đó kéo xuống thì các ô còn lại như [Viet], [Trung] và [Han Viet] cũng kéo xuống theo ==> tránh tình trạng dịch sót.
    - chuyển tính năng Find and Replace ở ô [Trung] sang cho ô [Viet]


    4. QT thiếu mất một bước sau cùng rất quan trọng đó là xử lý lỗi tiếng việt.
    Fix:
    Các lỗi linh tinh chứa trong sualoi.txt sẽ được xử lý sau cùng.
    Mã:
    biệt* ôm=đừng ôm
    biệt* ăn=đừng ăn
    biệt* đào=đừng đào
    biệt* đương=đừng tiếp tục
    tại* ngủ=đương ngủ
    tại* ngửi=đương ngửi
    tại* nghĩ=đương nghĩ
    một đem* súng=một khẩu súng
     
    Chỉnh sửa cuối: 17/2/17
    nhymxu, babylong10 and ﻲA Bư✯ like this.
  5. Poca

    Poca Thành viên kích hoạt

    Tham gia ngày:
    18/3/15
    Bài viết:
    380
    Được thích:
    227
    cái này ngoài lập trình ngon thì phải hiểu về ngữ pháp tàu nữa. Đâu phải dễ :v
     

Thành viên đang xem bài viết (Users: 0, Guests: 1)