معظم القطاعات ليست قواعد بيانات SaaS نظيفة ومُجهزة جيدًا؛ والحقيقة هي المستندات القبيحة، والمخططات الخاصة، وسير العمل الضمني، والمهام الطويلة الأمد التي تعاني منها معظم النماذج ذات الأغراض العامة.

دفع هذا الأمر شركة إدارة مشاريع البناء Trunk Tools إلى إنشاء بنية متخصصة ثلاثية الطبقات – الإدراك والدلالات والوكلاء – استنادًا إلى بيانات مفصلة للغاية لدعم أتمتة الصناعة عالية الدقة وذات الصلة للغاية.

يقول ترنك إن مجموعتهم المصممة خصيصًا لهذا الغرض قلصت دورات المراجعة من أشهر إلى أيام، ومنعت الأخطاء الميدانية المكلفة، ومنح العملاء المستقلين القدرة على التفكير المنطقي في ملايين الصفحات من الوثائق.

قالت سارة بوشنر، المؤسس والرئيس التنفيذي لشركة Trunk والنجار السابق: “لقد شرعنا حقًا في أخذ البيانات من الأنظمة المتفرقة، ومعالجتها مسبقًا، وهيكلتها، والانتقال إلى رسم بياني معرفي، ثم تدريب نماذج الذكاء الاصطناعي”.

بالنسبة لشركات البناء في القطاعات الأخرى، يمكن أن يكون نهج Trunk بمثابة مخطط لتحويل فوضى البيانات إلى مسارات عمل جاهزة للوكلاء ومخصصة للصناعة.

حيث تقوم ماجستير إدارة الأعمال للأغراض العامة بتحليل بيانات الصناعة

على الرغم من أن شهادات LLM التأسيسية قوية، إلا أنها تم تحسينها من أجل الاتساع، وليس العمق دائمًا.

قال كريتي فوجدار، كبير مديري المنتجات الذين يعملون في البنية التحتية للذكاء الاصطناعي، والذكاء الاصطناعي الوكيل، والأمن، ومنصات LLM: “يتم تدريب الحاصلين على ماجستير إدارة الأعمال للأغراض العامة ليكونوا على ما يرام في كل شيء، لذا فهم ضعفاء في أي شيء متخصص”. على سبيل المثال: المصطلحات النادرة، والاستدلال الخاص بالمجال، والسياق غير المعلن الذي “يعرفه” أي ممارس.

وافق سيباستيان دي بوليفييه، مطور الويب والتطبيقات والبرمجيات، على أن أكبر عنق الزجاجة هو الاعتماد على البيانات “المصطلحات الكثيفة، والمختصرات الثقيلة، والمحددة التنسيق”.

وقال: “يمكن لنموذج فئة GPT-4 أن يفهم العقد القانوني الفرنسي، لكنه سيتلعثم في مراجع المقالات المحددة التي يحتاج الممارسون إلى الاستشهاد بها”.

علاوة على ذلك، أشار فوجدار إلى أن البيانات المؤسسية الأكثر قيمة لم تصل أبدًا إلى التدريب المسبق على أي حال. إنه موجود في الأنظمة الداخلية وتنسيقات الملكية. قالت: “إن RAG يساعد قليلاً”. “لكنه مجرد إعطاء حقائق أفضل لنموذج لا يزال غير قادر على التفكير بشكل صحيح في هذا المجال.”

يعد التدريب المسبق على بيانات المجال أمرًا بالغ الأهمية؛ يجب على المؤسسات بعد ذلك تحسين أمثلة المهام الجيدة وبناء تقييماتها الخاصة. “إن بضعة آلاف من الأمثلة من ممارسين حقيقيين تتفوق على ملايين الأمثلة المزعجة والصاخبة،" قال فوجدار.

يمكن لمزيج الخبراء (MoE) توفير التخصص دون زيادة تكاليف الاستدلال. يعمل أيضًا إقران RAG مع الضبط الدقيق بشكل جيد؛ يتعامل RAG مع المسار الطويل الواقعي بينما يعمل الضبط الدقيق على إصلاح المفردات والتفكير.

وأشار دي بوليفييه إلى ميزة الأكوام الهجينة: نموذج للأغراض العامة للاستدلال والتنسيق، ونموذج أصغر حجمًا (أو استرجاع كثيف عبر مجموعة منسقة) لاستخراج مجال محدد. ونصح قائلاً: “لا تقم بضبط النموذج لجعله “أكثر ذكاءً” فيما يتعلق بالمجال، بل قم بضبطه لجعله أكثر موثوقية في تنسيق الإخراج المحدد الذي يتطلبه سير عملك.”

وقال دي بوليفييه إن التجارة والبناء هي بالتأكيد صناعات تشهد جذبًا لهذه التقنيات، وكذلك القانون والرعاية الصحية. تحتوي هذه القطاعات على “مخاطر عالية للأخطاء بالإضافة إلى تنسيقات المستندات الموحدة، مما يعادل عائد الاستثمار الواضح للتدريب على المجال”.

أحد التحذيرات الصادقة الجديرة بالذكر، قال فوجدار: غالبًا ما تنهار النماذج المتخصصة خارج مجالها، لذا فهي غالبًا ما لا تكون مفيدة خارج نطاق خبرتها (ما لم يتم إعادة تدريبها).

الإدراك والدلالات والوكلاء: داخل كومة Trunk المكونة من ثلاث طبقات

وفي المجالات عالية التخصص مثل البناء، فإن “تفريغ البيانات” في نماذج اللغات الكبيرة (LLMs) لا يفي بالغرض، كما قال أمريش كابور، كبير مسؤولي التكنولوجيا في شركة Trunk. وذلك لأن معظم المحولات هي نماذج احتمالية: عندما يتم إعطاؤها صورة، فإنها تشير إلى أنها “على الأرجح” شجرة، أو “على الأرجح” طفل يلعب بجوار شجرة.

وهذا يجعلها غير كافية للتفسير الرمزي عالي الدقة. على سبيل المثال، في وثائق البناء، يكون للرمز الذي يبلغ عرضه 2 ملم معنى مختلف تمامًا اعتمادًا على مكان وضعه.

علاوة على ذلك، فإن النماذج الاحتمالية، المقيدة بقيود السياق، تكافح مع ذاكرة المشروع طويلة المدى. قال كابور: “لا أقصد نافذة سياقية لعدد قليل من الرموز”. “أنا أتحدث عن الذاكرة طويلة المدى التي تمتد عبر الأشهر والسنوات، لأن هذه هي المدة التي تستغرقها بعض هذه المشاريع.”

بدلاً من ذلك، يقوم نظام Trunk المكون من ثلاث طبقات بتقسيم سير العمل إلى:

  • الإدراك (قراءة واستخراج البيانات من المستندات الفوضوية مثل ملفات PDF أو الرسومات أو عمليات المسح الضوئي)

  • طبقة دلالية/رسمية (فهم تلك البيانات وفهم العلاقات بينها).

  • LLMs والوكلاء في الأعلى.

وقال بوشنر إن رسومات البناء عادة ما تكون رمزية. لا يُسمى الباب دائمًا “باب”. في بعض الأحيان يكون الأمر مجرد قوس على الحائط تتعلم العين المدربة قراءته بناءً على سنوات من الممارسة.

وقالت: “إن طبقة الإدراك هي التي تعلم الذكاء الاصطناعي قراءة تلك اللغة”. ثم تعطي الطبقة الدلالية معنى لهذه المعلومات؛ على سبيل المثال، ربط الباب بالرسم الذي يفصله، والمواصفات التي تحكمه، والتجارة التي تثبته. يساعد هذا في الإجابة على الأسئلة المهمة لمهندسي المشروع: لا "هل هناك باب هنا؟" لكن "هل هذا الباب يخلق مشكلة أسفل الخط؟"

وهذا التحول مهم بشكل خاص في مجال البناء، لأن تكلفة المشكلة تتفاقم مع مرور الوقت. قال بوخنر: “إن تكلفة معالجة الصراع الذي يتم اكتشافه في التصميم منخفضة نسبيًا، في حين أن نفس المشكلة التي يتم اكتشافها في الميدان قد تكلف عشرات الآلاف من الدولارات”.

على مستوى عالٍ، يحدد النظام نوع المستند ويبدأ في استخراج المعلومات بناءً على المحتوى (الرسم، الجداول الزمنية، نص الفقرة). يتم بعد ذلك “تحويل هذه البيانات وزيادتها” في النظام الأساسي، مما يؤدي إلى تشغيل مسارات عمل وكيلة مثل علاقات الرسم البياني المعرفي وسير عمل المستخدم النهائي.

على سبيل المثال، قد يقوم الوكيل بمراجعة نشرة معمارية وإنتاج تراكب مرئي يقارن بين إصدار أقدم وإصدار أحدث (وضع علامة على الإضافات والإزالة)، ثم إنشاء روايات مكتوبة تصف ماهية هذه التغييرات بعبارات بسيطة. يساعد ذلك المستخدمين على فهم ما تم تغييره والتنسيق مع الشركاء التجاريين بشأن الأسعار المحدثة وأوامر التغيير.

حجم مشكلة بيانات البناء

وقال بوشنر إن سير عمل البناء “مليء بالافتراضات الضمنية والروابط بين البيانات في عدد لا يحصى من المصادر”. وكمية البيانات غير المنظمة “من المستحيل إنسانيًا” معالجتها أو فهمها.

وقدر بوشنر أن متوسط ​​المباني الشاهقة يولد حوالي 3.6 مليون صفحة من الوثائق المقابلة. “إذا طبعته على كومة من الأوراق، فسيكون بارتفاع المبنى نفسه.”

وأوضح كابور أن الطبقات الثلاث من مجموعة ترانك – الإدراك، والدلالة، وماجستير القانون – يتم تدريبها على “مجموعات بيانات محددة للغاية” من العملاء الذين لديهم “أذونات صريحة” ووضع العلامات التلقائية/IP. يمكن للعملاء الذين لا يريدون تدريب Trunk على بياناتهم إلغاء الاشتراك.

يتم إلغاء تحديد البيانات وتجميعها، ويقوم Trunk أيضًا بجمع “أطنان أكثر” من البيانات المصنفة من خلال مسارات أخرى مثل نمذجة معلومات البناء ثلاثية الأبعاد (BIM).

تقول شركة Trunk إنها تقوم فقط بشحن العملاء الذين يحققون دقة تبلغ حوالي 95٪. يحتفظ الفريق بخطوط تقييم مستمرة بناءً على بيانات الحقيقة الأرضية من العملاء والخبراء. كما أنهم يستخدمون نموذج LLM كقاض.

قال كابور: “إن فكرة الحصول على ماجستير في القانون كقاضٍ هي تسجيل مدى جودة أدائك، سواء على المستوى الذاتي أو الموضوعي”. يمكن أن تكون الموضوعية “صوابًا” أو “ليس صحيحًا” بسهولة، لكن الذاتية تتطلب المزيد من الفروق الدقيقة.

على سبيل المثال، عند إنشاء بريد إلكتروني أو سرد أو شرح، يمكن لإطار LLM كإطار للقاضي إنشاء درجة مركبة، أو قيمة رقمية تجمع مقاييس مختلفة وتختبر أداء النموذج أو مخاطره.

ومع ذلك، قد تكون هناك تحديات، خاصة فيما يتعلق بزمن الوصول، كما أشار بوخنر. في أي وقت تزداد فيه القدرة الاستدلالية للنماذج الأساسية، يرتفع خطر الكمون أيضًا. يحتفظ Trunk بمجموعة من معايير التقييم لقياس زمن الاستجابة بشكل موضوعي عند إجراء تغييرات على البنية التحتية الأساسية والوكلاء واستدعاءات واجهة برمجة التطبيقات (API).

وقال بوشنر: “قبل أن نصدره للعملاء، نتأكد من أن التغييرات الهامشية في تجربة المستخدم النهائي تستحق تحسينات الأداء”.

من 60 يومًا إلى 10: المردود القابل للقياس

تعمل منصة Trunk على تشغيل سبعة من عملاء الذكاء الاصطناعي المصممين خصيصًا للبناء، مثل تحليل استجابات طلب المعلومات (RFI)، أو مراجعة العطاءات، أو مراجعة الرسومات والتقديمات.

على سبيل المثال، يقوم وكيل الإرسال بوضع علامة على المعلومات المفقودة أو المتضاربة أو غير المتوافقة في مواصفات المنتج وطلبات المعلومات (RFI). على الرغم من أنها خطوة أساسية في عملية البناء، إلا أنها “سير عمل مزعج للغاية”، كما قال بوشنر، لأنه يتعين على المراجعين البشريين مقارنة المستندات “مع مجموعة من الأجزاء الأخرى من المستندات”.

لكن الوكيل قادر على القيام بذلك في ثوانٍ، ويقول ترانك إنه خفض دورات التقديم من 50 إلى 60 يومًا إلى 10، “وهو ما ينطوي على جدول زمني ضخم وآثار مالية”.

وقال بوشنر إن ترانك موجود الآن في مكان يتواصل فيه هؤلاء العملاء مباشرة مع بعضهم البعض، وهو أمر “مثير للغاية”. لذلك، على سبيل المثال، سيقوم أحد الوكلاء بمراجعة الرسم المعماري للتأكد من دقته، ثم يسلمه بشكل مستقل إلى الوكلاء الذين يتعاملون مع طلبات المعلومات ويطرحون أسئلة المتابعة.

وأوضح بوشنر: “إذا كانت هناك مشاكل في الرسومات، فإن وكيل RFI يتولى المسؤولية ويتواصل بنشاط للحصول على التوضيح”.

يقول Trunk أن عملائه يبلغون عن توفير ما بين 20 إلى 40 دقيقة لكل سؤال ميداني. وقال بوخنر إن المستخدمين في هذا المجال يعرفون أكثر من أي شخص آخر مدى “امتصاص الوقت” للانتقال من مقطورات المكاتب ذهابًا وإيابًا، والتنقيب في مستندات المشروع في أنظمة متناثرة أو ملفات PDF مطبوعة، وتسوية التناقضات، والعودة للتنسيق مع الشركاء التجاريين.

تقول شركة Trunk أن عملائها يبلغون عن هذه النتائج الإضافية:

  • متوسط ​​توفير الوقت 8 دقائق لاسترجاع مستند واحد (فحص الحالة، البحث عن الموقع، الاستعلامات عن الكمية).

  • متوسط ​​توفير الوقت لمدة 20 دقيقة للمرجع القياسي (الإحالة المرجعية من 2 إلى 3 أقسام المواصفات لتكوين إجابة.

  • متوسط ​​توفير الوقت لمدة 40 دقيقة للبحث متعدد المستندات (سرد الاستعلامات وتصفيتها، ورسم خرائط العلاقات، وتحليل طلبات المعلومات والإرسالات عبر 4 إلى 6 مستندات).

  • متوسط ​​توفير الوقت لمدة 75 دقيقة للمهام المعقدة (إنشاء طلبات المعلومات ومواد الاتصال الأخرى، والإحالة المرجعية العميقة عبر المستندات، وتتبع التغيير).

في إحدى الحالات، أشار وكيل مراجعة الرسم في Trunk إلى أنه قد تم نقل عارضة هيكلية لأعلى بمقدار 8.5 بوصة. ومع ذلك، لم يتم توثيق ذلك من قبل المهندس المعماري. وقال بوشنر إنه إذا لم يتم اكتشاف التغيير، فمن المحتمل أن يضطر مدير المشروع إلى إزالة الحزمة ذات الحجم المناسب وإعادة تركيبها. وكان من شأن إعادة العمل هذه أن تضيف 10 آلاف دولار أو أكثر إلى الميزانية، و”بالتأكيد ستكون هناك آثار على الجدول الزمني”.

وأشار بوخنر أيضًا إلى أمثلة أخرى: أبلغ أحد الوكلاء عن مبلغ 60 ألف دولار في أسعار مبالغ فيها دون أي مبرر من مقاولي الباطن لتنسيق الحدائق؛ تحديد مدفأة يجب إغلاقها قبل تركيب الحوائط الجافة، مما يوفر حوالي 100000 دولار من العمالة والمواد والتأخير؛ وأشار إلى أن الباب الكهربائي يتطلب لوحة غير مدرجة في الرسومات الكهربائية.

دروس للصناعات الأخرى

ينطبق نهج Trunk تجاه وكلاء البناء على أي عمل رأسي يحتوي على كميات كبيرة من البيانات غير المنظمة الخاصة بالصناعة. وقال بوشنر إنه يجب على شركات البناء التي تعمل في قطاعات محددة أن تفهم تحديات البيانات المحددة في الصناعة التي يواجهها المستخدمون النهائيون وأن يبنوا بنية تحتية تقنية يمكنها تحويل البيانات غير المنظمة إلى شيء “يمكن لخريجي ماجستير إدارة الأعمال اجتيازه وفهمه”. “عندها فقط يمكنك بناء الاتصالات بين نقاط البيانات التي تغذي في النهاية سير العمل الوكيل.” ينصح بوخنر باستثمار الكثير من الأموال في النماذج الأساسية، لذلك يجب على الشركات بناء أنظمة معيارية يمكنها الاستفادة من نقاط القوة في النماذج المختلفة مع استمرارها في التحسن. وقالت بعد ذلك: “قم ببناء ميزتك التقنية حيث لا تستثمر النماذج العامة ولا تؤدي أداءً جيدًا”.

شاركها.
اترك تعليقاً