ข้ามไปเนื้อหา

ผู้ใช้:Octahedron80

จาก วิกิพจนานุกรม พจนานุกรมเสรี
ข้อมูลภาษาของผู้ใช้
th-N ผู้ใช้คนนี้ใช้ภาษาไทยเป็นภาษาแม่
en-3 This user has advanced knowledge of English.
zh-1 这位用户的中文达到初级水平
cmn-1 This user has basic knowledge of Mandarin Chinese.
ja-1 この利用者は初級日本語ができます。
{{t}}-3 ผู้ใช้นี้สามารถเขียนแม่แบบวิกิได้ในระดับสูง สามารถเขียนโค้ดที่ซับซ้อนได้
JS-3 ผู้ใช้นี้สามารถเขียนจาวาสคริปต์ได้ในระดับสูง สามารถเขียนโค้ดที่ซับซ้อนได้
lua-3 Cet utilisateur dispose de connaissances avancées en ciluba.
Python-2 ผู้ใช้นี้สามารถเขียนภาษาไพทอนได้ในระดับปานกลาง สามารถเข้าใจโค้ดที่คนอื่นเขียนได้
ผู้ใช้ตามภาษา
UTC+7 ผู้ใช้นี้อยู่ในเขตเวลา UTC+7
  • 🏠 วิกิพจนานุกรมภาษาไทย มากยิ่งกว่า วิกิพีเดียภาษาไทย
  • 🇹🇭󠁔󠁈 ประเทศไทย
  • 🎓 วท.บ. (ศาสตร์คอมพิวเตอร์) และ บธ.บ. (การตลาด)
  • 🤖 ผู้ใช้:OctraBot (ปัจจุบันใช้ PAWS)
  • 😅 ขออภัยหากข้าพเจ้าแก้ไขหน้าใดหน้าหนึ่งมากครั้งเกินไป

หน้าย่อย

[แก้ไข]

อื่น ๆ สำหรับทดสอบ

[แก้ไข]

สถานะโครงการ

[แก้ไข]
  • มีมาตรฐานรูปแบบการเขียนแล้ว แต่บางครั้งต้องสร้างแม่แบบของภาษาต่าง ๆ ขึ้นมาเฉพาะ เพราะไวยากรณ์ต่างกัน รูปแบบการเขียนของคำเก่า ๆ ต้องทยอยปรับปรุงไปเรื่อย ๆ
  • หน้าที่ต้องการเก็บกวาดให้เป็นมาตรฐานมีจำนวนมาก เพราะคนเก่า ๆ สร้างไว้นานแล้ว
  • ลิงก์เชื่อมโยงระหว่าง WT ภาษาอื่น ในหน้าคำศัพท์ ไม่จำเป็นต้องมีอีกต่อไป เพราะส่วนขยาย Cognate เชื่อมโยงกันโดยอัตโนมัติ
    • บางหน้ายังจำเป็น เช่น ภาษามือ คำยาวมาก หรือคำที่มีตัวอักษรที่ใช้ตั้งชื่อไม่ได้
  • เนมสเปซอื่นนอกเหนือจากคำศัพท์ เช่น วิกิพจนานุกรม หมวดหมู่ เชื่อมโยงถึงกันได้จากวิกิสนเทศ บางชื่อมีรูปแบบที่ชัดเจนสามารถใช้บอตได้ นอกนั้นต้องเพิ่มด้วยมือ
  • เนื่องจากเราใช้มอดูลลูอาตามแบบวิกิพจนานุกรมภาษาอังกฤษ ในเวลานี้เริ่มซับซ้อนมากขึ้น การอัปเดตมอดูลหนึ่งอาจกระทบมอดูลอื่น ทำให้เกิดข้อผิดพลาดเป็นลูกโซ่ ต้องพยายามทำให้บ่อยขึ้น เดี๋ยวจะตามไม่ทัน
  • มีการก่อกวนประปราย จากผู้ใช้ลงทะเบียนและไม่ลงทะเบียน คนที่ก่อกวนก็เป็นคนเดิม ๆ บางทีก็ลามมาจากวิกิพีเดีย
    • การบล็อก IPv4 เป็นรายไอพีด้วยระยะเวลายาวนานไม่ได้ผล เพราะ IPv4 ได้แจกไปจนหมดโลกนานแล้ว ISP ต่าง ๆ ต้องเวียนเอาไอพีที่ว่างอยู่มาใช้ ซึ่งเปลี่ยนบ่อยแทบทุกชั่วโมง และคนที่ก่อกวนก็จะได้ไอพีใหม่ทุกชั่วโมง และหนึ่งไอพีก็เชื่อมโยงแบบระดับชั้นไปหลายบ้านด้วย (มือถือก็เหมือนกัน) ทำให้คนที่ไม่ได้ก่อกวนหรือมีเจตนาดีถูกบล็อกไปด้วย การบล็อก IPv4 ที่มีประสิทธิภาพจึงทำได้เพียง 1 ชั่วโมง อย่างมากก็ 1 วัน (เน็ตบ้านอัตราเดิม)
    • สามารถบล็อก IPv4 range ได้ เพราะคนก่อกวนมักจะใช้เครือข่ายเดิม ไอพีขึ้นต้นก็จะเป็นเลขเดิม แต่ก็ไม่ควรบล็อกนาน (ที่คิดไว้คือ 1 เดือนแล้วค่อยต่อใหม่หากมีการก่อกวนอีก) เพราะคนที่ได้รับผลกระทบมีมาก และต้องเปิดทางให้สร้างบัญชีได้
    • การบล็อก IPv6 เป็นรายไอพีด้วยระยะเวลายาวนานสามารถทำได้ เพราะไม่มีการใช้ซ้ำ ยังมีไอพีเหลือเฟือ และแทบจะไม่เปลี่ยน

ช่วยกันหน่อย

[แก้ไข]

คำแนะนำ

[แก้ไข]
  • จำนวนคำในภาษาหนึ่งมีเป็นแสน ๆ ถ้าเขียนวันละคำชาตินี้ก็ไม่เสร็จ ดังนั้นควรเขียนวันละไม่ต่ำกว่า 100 คำ
  • คำสั้นมักจะมีหลายภาษารวมกันอยู่มาก ทำให้ขี้เกียจแปลและจัดเรียง ถ้าเริ่มต้นสร้างคำยาวก่อน มีภาษาน้อย อาจจะทำได้เร็วกว่า
    • ใช้สคริปต์แมว ๆ ช่วยเก็บกวาดเนื้อหาที่ลอกมาจาก WT ภาษาอังกฤษ ประหยัดเวลาในการเขียนเอง
  • ข้อความแจ้งเตือนข้อผิดพลาด และเอกสารกำกับ ของแม่แบบและมอดูล ไม่ต้องแปลก็ได้
  • หมวดหมู่ที่ต้องการ บางหมวดหมู่มีไว้เพื่อติดตามงานเท่านั้น ไม่จำเป็นต้องสร้างขึ้นมา
  • ส่วนหนึ่งของชื่อภาษา
    • Proto-... = ...ดั้งเดิม ส่วนชื่อข้างหน้าทับศัพท์มาเลย
    • ชื่อกลุ่มภาษาทับศัพท์มาเช่นกัน
    • Middle = กลาง; Central = ตอนกลาง (ยกเว้น Mandarin = จีนกลาง; Middle Chinese = จีนยุคกลาง)
    • Old = เก่า; Ancient = โบราณ (เท่าที่เห็นมี Ancient Greek = กรีกโบราณ เท่านั้น ภาษาอื่นใช้เป็นชื่อพ้อง)
    • dialect/minor language ที่ขยายชื่อภาษา ใช้คำว่า "แบบ" เหมือนกันหมด เพราะบางครั้งไม่ได้อ้างถึงประเทศหรือเมือง
    • early = ช่วงต้น; late = ช่วงปลาย
  • ชนิดของคำที่อาจสร้างความสับสน
    • acronym = อักษรอ่านย่อ (คำที่เอาอักษรตัวหน้ามาและอ่านรวมกัน เช่น UNESCO, OPEC, NASA ฯลฯ; ใช้แทนศัพท์บัญญัติว่า รัสพจน์ ซึ่งคนทั่วไปไม่รู้จัก)
    • initialism = อักษรย่อ (คำที่เอาอักษรตัวหน้ามาแต่ไม่อ่านรวม; ภาษาไทยส่วนมากเป็นอันนี้)
    • clipping = คำตัดทอน (คำยาวที่ถูกตัดเป็นคำสั้นลง)
    • contraction = คำหดย่อ (คำที่หดย่อจากหลายคำเหลือคำเดียว เช่น isn't l'more je t'aime)
    • abbreviation = คำย่อ (คำที่ไม่ใช่ทั้งหมดด้านบน)
    • shortening = การย่อ (หมวดหมู่ใหญ่ที่คลุมทั้งหมดด้านบน)
  • PSWT ก่อนหน้านี้อิงกับระบบของ Li อย่างเดียว ภายหลังพบว่า ก็ยังมีของอีกหลายคนที่เกิดขึ้นทีหลังอย่างเช่น Jonsson และต่อมา Pittayaporn ปรับปรุงระบบทั้งหมดนั่นใหม่ จึงควรเปลี่ยนไปใช้ระบบ Pittayaporn ทั้งหมด เพื่อที่จะนำไปใส่เนมสเปซ การสืบสร้าง (Reconstruction) [ยังไม่ได้โหวต] ขณะนี้ก็ยังมีระบบ Li ตกค้างอยู่หลายหน้า ส่วนวรรณยุกต์ยึดตามระบบ Gedney คือ A B C DS DL และกลุ่มพยัญชนะ 4 กลุ่มซึ่งครอบคลุมที่สุด (มีบางภาษาที่ทั้ง 4 กลุ่มผันเสียงต่างกัน จึงต้องคงไว้)
  • ชื่อวันและชื่อเดือน (จันทรคติหรือสุริยคติก็ตาม) บางภาษาให้เป็นคำวิสามานยนาม บางภาษาให้เป็นคำสามานยนาม
  • เอกโทษและโทโทษ ให้ใส่เป็นรูปแบบอื่นได้ ก็ต่อเมื่อเคยมีปรากฏในโคลงมาแล้ว

ปัญหาแปลก ๆ ด้านเทคนิค

[แก้ไข]
  • อักขระที่มองไม่เห็น สามารถสังเกตได้จาก URL หรือการถอดเป็นอักษรไทย
    • ZWSP (U+200B) หรือเครื่องหมายจัดรูปแบบอื่น ๆ ที่มองไม่เห็น มักเกิดจาก Word หรือ Machine Learning ต้องตัดออกเพราะถูกใช้เป็นตัวตัดคำ/บรรทัด ไม่มีผลในการค้นหา แต่จะทำให้เชื่อมโยงคำกันไม่เจอ และจะทำให้คนสร้างหน้าใหม่ซ้ำ
    • ZWNJ (U+200C) และ ZWJ (U+200D) ควรคงไว้เพราะเกี่ยวกับการเปลี่ยนรูปอักษร (ภ.เปอร์เซีย, อูรดู, สิงหล, อีโมจิ) การใส่กับไม่ใส่ ZWNJ/ZWJ จะให้ผลลัพธ์เป็นคนละหน้า ถ้าการพิมพ์ปกติไม่ได้ใช้ ZWNJ/ZWJ ควรขจัดออกให้หมด
  • ตัวอักษรในภาษาไทดั้งเดิมและไทตะวันออกเฉียงใต้ดั้งเดิม ᴬ ᴮ ꟲ ᴰ ᴸ ˢ ซึ่งใช้แทนวรรณยุกต์
    • มาตรฐานยูนิโคด 14.0 มี C ตัวใหญ่แล้ว คือ ꟲ (U+A7F2)
    • ตัว s เป็นตัวเล็ก เพราะไม่มีตัวใหญ่ให้ใช้
  • คุณลักษณะ OpenType ทำงานไม่ครบถ้วนในเบราว์เซอร์
    • อักษรไทธรรม เวลามีพยัญชนะมากกว่า 1 ตัว เช่นอักษรซ้อนหรือตัวควบกล้ำ (เช่น ᨣᩕ) แล้วใส่สระหน้าตาม (เช่น ᩮ) บางฟอนต์/OS สระหน้าไม่ยอมไปอยู่ข้างหน้าสุด เช่น ᨣ+ᩕ+ᩮ มันควรจะเป็น ᩮ‍ᨣᩕ ไม่ใช่ ᨣᩕ‍ᩮ
    • อักษรไทลื้อใหม่ อักษรไทเวียด มาตรฐานปัจจุบันให้ใส่ตามลำดับปรากฏ (เหมือนไทย-ลาว) แต่บางฟอนต์/OS ดึงสระหน้าที่ตามหลังพยัญชนะไปไว้ข้างหน้า เช่น ᦃ‌ᦶᦈ กลายเป็น ᦶᦃᦈ แล้วก็จะได้คำที่สะกดผิดทั้งที่เราคีย์ถูก
    • วิธีแก้เบื้องต้นคือใส่ ZWNJ (ระหว่างพยางค์) หรือ ZWJ (อยู่ในพยางค์) มาคั่นในศัพท์ ผ่านทางจาวาสคริปต์ มีเดียวิกิ:Gadget-legacy.js (ใช้ได้เฉพาะผู้ที่เป็นสมาชิก) เนื่องจาก DISPLAYTITLE ไม่ทำงานแล้ว ซึ่งจะเปลี่ยนเฉพาะการแสดงผลเท่านั้น การเชื่อมโยงต่าง ๆ ยังเหมือนเดิม
  • ภาษาถิ่นที่ใช้อักษรไทย มีพยัญชนะบางตัวที่ประพินทุ (nuqta) หรือขีดล่าง (macron) แล้วมีสระบน/ล่าง การป้อนตามตรรกะควรเป็น พยัญชนะ+พินทุ/ขีดล่าง+สระบน/ล่าง เพื่อให้ลิงก์หากันเจอ แต่หลายฟอนต์แสดงผลโดยวางพินทุ/ขีดล่างไว้ต่ำกว่าสระล่าง หรือวางทับกัน อาจทำให้สับสนได้
  • Combining Diacritical Marks ควรใช้ได้กับอักษรทุกแบบ เพราะเป็นกลุ่มอักษร Inherited แต่ในความเป็นจริงหลายฟอนต์ก็ไม่ได้ทำมาให้รองรับ เช่น การเติมสัญลักษณ์กำกับตัวอักษรไทย ทำให้ตัวอักษรทับซ้อนกัน หรือกลายเป็นกล่องว่าง เราต้องเข้าใจตามตรรกะว่าได้ใส่เครื่องหมายถูกต้องแล้ว
  • อักษรยาวีของกลุ่มภาษามาเลย์อิกทั้งหมด ให้ใช้ ک และ ݢ เท่านั้น ห้ามใช้ ك และ ڬ ของกลุ่มภาษาอาหรับ เพราะมันแสดงผลต่างกัน (ระบุไว้ในเอกสารยูนิโคด)
  • ฐ/ญ ไม่มีเชิง สำหรับภาษาบาลี/สันสกฤต ฟอนต์ Noto Sans Thai Looped สามารถแสดงผลให้แตกต่างกันได้ (มีฟอนต์เดียวที่ทำได้ในขณะนี้) ส่วนการตั้งชื่อหน้าให้ใช้ ฐ/ญ ปกติ
  • แม่แบบหลายแม่แบบ (มาก) ไม่ได้ทำมาให้รองรับโหมดมืด เช่น การใส่สีขาวไว้ในช่องตาราง ทำให้กลืนไปกับตัวหนังสือที่กลับสีเป็นสีสว่าง ซึ่งก็ต้องทยอยแก้ไปทีละแม่แบบ

บันทึก

[แก้ไข]