ข้ามไปเนื้อหา

ผู้ใช้:Octahedron80

จาก วิกิพจนานุกรม พจนานุกรมเสรี
ข้อมูลภาษาของผู้ใช้
th-N ผู้ใช้คนนี้ใช้ภาษาไทยเป็นภาษาแม่
en-3 This user has advanced knowledge of English.
zh-1 这位用户的中文达到初级水平
cmn-1 This user has basic knowledge of Mandarin Chinese.
ja-1 この利用者は初級日本語ができます。
pi-1 अयं पुग्गलो पालिभासायं मूलकमेन बहुस्सुतधरो॥
{{t}}-3 ผู้ใช้นี้สามารถเขียนแม่แบบวิกิได้ในระดับสูง สามารถเขียนโค้ดที่ซับซ้อนได้
JS-3 ผู้ใช้นี้สามารถเขียนจาวาสคริปต์ได้ในระดับสูง สามารถเขียนโค้ดที่ซับซ้อนได้
lua-3 Cet utilisateur dispose de connaissances avancées en ciluba.
Python-2 ผู้ใช้นี้สามารถเขียนภาษาไพทอนได้ในระดับปานกลาง สามารถเข้าใจโค้ดที่คนอื่นเขียนได้
ผู้ใช้ตามภาษา
UTC+7 ผู้ใช้นี้อยู่ในเขตเวลา UTC+7
  • 🏠 วิกิพจนานุกรมภาษาไทย มากยิ่งกว่า วิกิพีเดียภาษาไทย
  • 🇹🇭󠁔󠁈 ประเทศไทย
  • 🎓 วท.บ. (ศาสตร์คอมพิวเตอร์) และ บธ.บ. (การตลาด)
  • 🤖 ผู้ใช้:OctraBot (ปัจจุบันใช้ PAWS)
  • 😅 ขออภัยหากข้าพเจ้าแก้ไขหน้าใดหน้าหนึ่งมากครั้งเกินไป

หน้าย่อย

[แก้ไข]

อื่น ๆ สำหรับทดสอบ

[แก้ไข]

สถานะโครงการ

[แก้ไข]
  • มีมาตรฐานรูปแบบการเขียนแล้ว แต่บางครั้งต้องสร้างแม่แบบของภาษาต่าง ๆ ขึ้นมาเฉพาะ เพราะไวยากรณ์ต่างกัน รูปแบบการเขียนของคำเก่า ๆ ต้องทยอยปรับปรุงไปเรื่อย ๆ
  • หน้าที่ต้องการเก็บกวาดให้เป็นมาตรฐานมีจำนวนมาก เพราะคนเก่า ๆ สร้างไว้นานแล้ว
  • ลิงก์เชื่อมโยงระหว่าง WT ภาษาอื่น ในหน้าคำศัพท์ ไม่จำเป็นต้องมีอีกต่อไป เพราะส่วนขยาย Cognate เชื่อมโยงกันโดยอัตโนมัติ
    • บางหน้ายังจำเป็น เช่น ภาษามือ คำยาวมาก หรือคำที่มีตัวอักษรที่ใช้ตั้งชื่อไม่ได้
  • เนมสเปซอื่นนอกเหนือจากคำศัพท์ เช่น วิกิพจนานุกรม หมวดหมู่ เชื่อมโยงถึงกันได้จากวิกิสนเทศ บางชื่อมีรูปแบบที่ชัดเจนสามารถใช้บอตได้ นอกนั้นต้องเพิ่มด้วยมือ
  • เนื่องจากเราใช้มอดูลลูอาตามแบบวิกิพจนานุกรมภาษาอังกฤษ ในเวลานี้เริ่มซับซ้อนมากขึ้น การอัปเดตมอดูลหนึ่งอาจกระทบมอดูลอื่น ทำให้เกิดข้อผิดพลาดเป็นลูกโซ่ ต้องพยายามทำให้บ่อยขึ้น เดี๋ยวจะตามไม่ทัน
  • มีการก่อกวนประปราย จากผู้ใช้ลงทะเบียนและไม่ลงทะเบียน บางทีก็ลามมาจากวิกิพีเดีย

ช่วยกันหน่อย

[แก้ไข]

คำแนะนำ

[แก้ไข]
  • จำนวนคำในภาษาหนึ่งมีเป็นแสน ๆ ถ้าเขียนวันละคำชาตินี้ก็ไม่เสร็จ ดังนั้นควรเขียนวันละไม่ต่ำกว่า 100 คำ
  • คำสั้นมักจะมีหลายภาษารวมกันอยู่มาก ทำให้ขี้เกียจแปลและจัดเรียง ถ้าเริ่มต้นสร้างคำยาวก่อน มีภาษาน้อย อาจจะทำได้เร็วกว่า
    • ใช้สคริปต์แมว ๆ ช่วยเก็บกวาดเนื้อหาที่ลอกมาจาก WT ภาษาอังกฤษ ประหยัดเวลาในการเขียนเอง
  • ข้อความแจ้งเตือนข้อผิดพลาด และเอกสารกำกับ ของแม่แบบและมอดูล ไม่ต้องแปลก็ได้
  • หมวดหมู่ที่ต้องการ บางหมวดหมู่มีไว้เพื่อติดตามงานเท่านั้น ไม่จำเป็นต้องสร้างขึ้นมา
  • ส่วนหนึ่งของชื่อภาษา
    • Proto-... = ...ดั้งเดิม ส่วนชื่อข้างหน้าทับศัพท์มาเลย
    • ชื่อกลุ่มภาษาทับศัพท์มาเช่นกัน
    • Middle = กลาง; Central = ตอนกลาง (ยกเว้น Mandarin = จีนกลาง; Middle Chinese = จีนยุคกลาง)
    • Old = เก่า; Ancient = โบราณ (เท่าที่เห็นมี Ancient Greek = กรีกโบราณ เท่านั้น ภาษาอื่นใช้เป็นชื่อพ้อง)
    • dialect/minor language ที่ขยายชื่อภาษา ใช้คำว่า "แบบ" เหมือนกันหมด เพราะบางครั้งไม่ได้อ้างถึงประเทศหรือเมือง
    • early = ช่วงต้น; late = ช่วงปลาย
  • ชนิดของคำที่อาจสร้างความสับสน
    • ในความหมายอย่างกว้าง acronym นั้นรวม initialism ไปด้วย แต่สำหรับวิกิพจนานุกรม จะแยกเป็นคนละอย่าง
      • acronym = อักษรย่อรวมพยางค์/ตัวย่อรวมพยางค์ (คำที่เอาอักษรตัวหน้ามาและอ่านรวมกันเป็นพยางค์ เช่น UNESCO, OPEC, NASA ฯลฯ; ศัพท์บัญญัติว่า รัสพจน์ แต่คนทั่วไปไม่รู้จัก)
      • initialism = อักษรย่อ/ตัวย่อ (คำที่เอาอักษรตัวหน้ามาแต่ไม่อ่านรวม; ภาษาไทยเกือบทั้งหมดเป็นอันนี้)
    • clipping = คำตัดทอน (คำยาวที่ถูกตัดทอนเป็นคำสั้นลง)
    • contraction = คำหดย่อ (คำที่หดย่อจากหลายคำเหลือคำเดียว เช่น isn't l'more je t'aime)
    • abbreviation = คำย่อ (กรณีอื่นที่ไม่ใช่ทั้งหมดด้านบน)
    • shortening = การย่อ (หมวดหมู่ใหญ่ที่คลุมทั้งหมดด้านบน)
  • PSWT ก่อนหน้านี้อิงกับระบบของ Li อย่างเดียว ภายหลังพบว่า ก็ยังมีของอีกหลายคนที่เกิดขึ้นทีหลังอย่างเช่น Jonsson และต่อมา Pittayaporn ปรับปรุงระบบทั้งหมดนั่นใหม่ จึงควรเปลี่ยนไปใช้ระบบ Pittayaporn ทั้งหมด เพื่อที่จะนำไปใส่เนมสเปซ การสืบสร้าง (Reconstruction) [ยังไม่ได้โหวต] ขณะนี้ก็ยังมีระบบ Li ตกค้างอยู่หลายหน้า ส่วนวรรณยุกต์ยึดตามระบบ Gedney คือ A B C DS DL และกลุ่มพยัญชนะ 4 กลุ่มซึ่งครอบคลุมที่สุด (มีบางภาษาที่ทั้ง 4 กลุ่มผันเสียงต่างกัน จึงต้องคงไว้)
  • ชื่อวันและชื่อเดือน (จันทรคติหรือสุริยคติก็ตาม) บางภาษากำหนดให้เป็นคำวิสามานยนาม บางภาษากำหนดให้เป็นคำสามานยนาม
  • เอกโทษและโทโทษ ให้ใส่ในหัวข้อรูปแบบอื่น ก็ต่อเมื่อเคยมีปรากฏในร้อยกรองมาแล้ว
  • การทับศัพท์ชื่อหรือภาษากลุ่มอินเดีย r=र=ร / l=ल=ล / ɭ=ळ=ฬ / ɽ=ड़=ฬฺ(ฑ̱) / ɽʱ=ढ़=ฬฺห์(ฒ̱) [แต่ก็ยังมี ऱ=รฺ(ร̱) / ऴ=ฬฺ(ฬ̱) ไม่มีในฮินดี ยังไม่พบที่ใช้] ; อนุสวารถอดเป็นพยัญชนะนาสิก ; ชื่อภาษาให้ตัดสระอีลงท้ายออกเพราะเป็นการผันรูปเพศหญิง (เว้นแต่คำนั้นไม่ได้มาจากการผัน) ถ้าตัดสระอีแล้วออกเสียงไม่ได้ หรืออ่านซ้ำกับชื่อภาษาอื่น ให้เลือกว่าจะเติมสระอะ หรือเติมทัณฑฆาต

ปัญหาแปลก ๆ ด้านเทคนิค

[แก้ไข]
  • อักขระที่มองไม่เห็น สามารถสังเกตได้จาก URL หรือการถอดอักษร
    • ZWSP (U+200B) หรือเครื่องหมายจัดรูปแบบอื่น ๆ ที่มองไม่เห็น มักเกิดจาก MS Word หรือ Machine Learning ต้องตัดออกเพราะถูกใช้เป็นตัวตัดคำ/บรรทัด ไม่มีผลในการค้นหา แต่จะทำให้เชื่อมโยงคำกันไม่เจอ และจะทำให้คนสร้างหน้าใหม่ซ้ำ
    • ZWNJ (U+200C) และ ZWJ (U+200D) ควรคงไว้เพราะเกี่ยวกับการเปลี่ยนรูปอักษร (ภ.เปอร์เซีย, อูรดู, สิงหล, อีโมจิ, ฯลฯ) การใส่กับไม่ใส่ ZWNJ/ZWJ จะให้ผลลัพธ์เป็นคนละหน้า ถ้าการพิมพ์ปกติไม่จำเป็นต้องใช้ ZWNJ/ZWJ ควรขจัดออกให้หมด
  • สัญลักษณ์วรรณยุกต์สำหรับภาษาไทดั้งเดิมและภาษาไทตะวันออกเฉียงใต้ดั้งเดิม: ᴬ ᴮ ꟲ ᴰ꟱ ᴰᴸ ¹ ² ³ ⁴
    • มาตรฐานยูนิโคด 14.0 มี C ตัวใหญ่แล้ว คือ ꟲ (U+A7F2) (วินโดวส์ 11 รองรับแล้ว)
    • มาตรฐานยูนิโคด 17.0 มี S ตัวใหญ่แล้ว คือ ꟱ (U+A7F1) (กำลังรอให้มีฟอนต์รองรับก่อน)
  • คุณลักษณะ OpenType ทำงานไม่ครบถ้วนในเบราว์เซอร์
    • อักษรไทธรรม เวลามีพยัญชนะมากกว่า 1 ตัว เช่นอักษรซ้อนหรือตัวควบกล้ำ (เช่น ᨣᩕ) แล้วใส่สระหน้าตาม (เช่น ᩮ) บางฟอนต์/OS สระหน้าไม่ยอมไปอยู่ข้างหน้าสุด เช่น ᨣ+ᩕ+ᩮ มันควรจะเป็น ᩮᨣᩕ ไม่ใช่ ᨣᩕ
    • อักษรไทลื้อใหม่ อักษรไทเวียด มาตรฐานปัจจุบันกำหนดให้ใส่สระหน้าก่อนพยัญชนะ (the visual ordering) แต่บางฟอนต์/OS ดึงสระหน้าที่ตามหลังพยัญชนะไปไว้ข้างหน้า เช่น ᦃ+ᦶ+ᦈ มันควรจะเป็น ᦃᦶᦈ ไม่ใช่ ᦶᦃᦈ แล้วก็จะได้คำที่สะกดผิดทั้งที่เราคีย์ถูก
    • วิธีแก้เบื้องต้นคือใส่ ZWNJ (ระหว่างพยางค์) หรือ ZWJ (อยู่ในพยางค์) มาคั่นในศัพท์ (เฉพาะการแสดงผล ไม่นำไปตั้งชื่อหน้า)
    • ขณะนี้ใช้งานสคริปต์ มีเดียวิกิ:Gadget-legacy.js เพื่อแก้ไขการมองเห็นเหล่านี้ (ใช้ได้เฉพาะผู้ที่เป็นสมาชิก) เนื่องจาก DISPLAYTITLE ไม่ทำงานอีกต่อไปแล้ว ซึ่งจะเปลี่ยนเฉพาะการแสดงผลเท่านั้น การเชื่อมโยงต่าง ๆ ยังเหมือนเดิม
  • ภาษาถิ่นที่ใช้อักษรไทย มีพยัญชนะบางตัวที่ประพินทุ (nuqta) หรือขีดล่าง (macron) แล้วมีสระบน/ล่าง การป้อนตามตรรกะควรเป็น พยัญชนะ+พินทุ/ขีดล่าง+สระบน/ล่าง เพื่อให้ลิงก์หากันเจอ แต่หลายฟอนต์แสดงผลโดยวางพินทุ/ขีดล่างไว้ต่ำกว่าสระล่าง หรือวางทับกัน อาจทำให้สับสนได้
  • Combining Diacritical Marks ควรใช้ได้กับอักษรทุกแบบ เพราะเป็นกลุ่มอักษร Inherited แต่ในความเป็นจริงหลายฟอนต์ก็ไม่ได้ทำมาให้รองรับ เช่น การเติมสัญลักษณ์กำกับตัวอักษรไทย ทำให้ตัวอักษรทับซ้อนกัน หรือกลายเป็นกล่องว่าง เราต้องเข้าใจตามตรรกะว่าได้ใส่เครื่องหมายถูกต้องแล้ว
  • อักษรยาวีของกลุ่มภาษามาเลย์อิกทั้งหมด ให้ใช้ ک และ ݢ เท่านั้น ห้ามใช้ ك และ ڬ ของกลุ่มภาษาอาหรับ เพราะมันแสดงผลต่างกัน (ระบุไว้ในเอกสารยูนิโคด)
  • รูป / ไม่มีเชิง ซึ่งใช้พิเศษสำหรับภาษาบาลี/สันสกฤต ฟอนต์ Noto Sans Thai Looped (ฟอนต์เดียวในขณะนี้) สามารถแสดงผลได้โดยการติดแท็กรหัสภาษา pi/sa ส่วนการตั้งชื่อหน้าให้ใช้รูป / ปกติ
    • คอมพิวเตอร์สมัยก่อนใช้ฟอนต์ที่มีรูป / ไม่มีเชิง แยกออกมาต่างหากจากรูปปกติ พอมาถึงสมัยยูนิโคด รูปเหล่านั้นถูกกำหนดให้อยู่ในช่วง PUA ซึ่งก็ไม่สามารถนำมาใช้ได้ในวิกิพจนานุกรมเนื่องจากนโยบาย
    • ภาษาถิ่นบางภาษาใช้รูป ไม่มีเชิงเช่นกัน เช่นภาษามลายูแบบปัตตานี แต่ยังไม่สามารถแสดงผลได้โดยการติดแท็กรหัสภาษา
  • แม่แบบหลายแม่แบบ (มาก) ไม่ได้ทำมาให้รองรับโหมดมืด เช่น การใส่สีขาวไว้ในช่องตาราง ทำให้กลืนไปกับตัวหนังสือที่กลับสีเป็นสีสว่าง ซึ่งก็ต้องทยอยแก้ไปทีละแม่แบบ

บันทึก

[แก้ไข]