يا هلا والله! اليوم بنتكلم عن شيء بيغير طريقة تعاملك مع الذكاء الاصطناعي: Gemini API من جوجل. إذا كنت مطور وتبي تضيف لمسة ذكاء قوية لتطبيقاتك، هذا الدرس لك.
وش هو Gemini API؟
ببساطة، Gemini هو أحدث وأقوى نموذج ذكاء اصطناعي متعدد الوسائط (Multimodal AI) من جوجل. الـ API حقه يخليك توصل لقدراته هذي بسهولة من خلال أكوادك. يعني تقدر تخليه يفهم نصوص، صور، وحتى مقاطع فيديو (قريبًا بشكل أوسع)، ويولد لك ردود عليها.
ليش Gemini بالذات؟
- متعدد الوسائط (Multimodal): مو بس نصوص، يقدر يشوف الصور ويفهمها ويتكلم عنها.
- قوي ومرن: فيه أكثر من إصدار (Pro, Ultra) يناسب احتياجات مختلفة، من المهام البسيطة للمعقدة.
- سهل الاستخدام: جوجل صممت الـ API بحيث يكون سهل للمطورين يبدأون فيه.
- مستقبل الذكاء الاصطناعي: جوجل بتستثمر فيه بشكل كبير، يعني تتوقع تطورات مستمرة.
يلا نبدأ: الإعداد الأول
1. جيب مفتاح الـ API حقك (API Key)
أول شيء تحتاجه هو مفتاح API. روح على Google AI Studio وسجل دخول بحسابك في جوجل. هناك بتلاقي خيار لإنشاء مفتاح جديد.
ملاحظة: لا تشارك مفتاح الـ API حقك مع أحد، واحرص إنك ما تحطه مباشرة في الكود حقك اللي بينشر للعامة. استخدم متغيرات البيئة (Environment Variables) عشان تحافظ على أمانه.
2. تثبيت مكتبة جوجل (بايثون كمثال)
أسهل طريقة للبدء هي باستخدام مكتبة جوجل الرسمية. بنستخدم بايثون كمثال لأنها شائعة جدًا:
افتح الطرفية (Terminal) ونفذ الأمر التالي:
pip install google-generativeai
3. كتابة أول كود لك مع Gemini!
هذا كود بسيط يوريك كيف تستخدم Gemini عشان يولد لك نص:
import google.generativeai as genai
import os
# قم بتعيين مفتاح API الخاص بك من متغيرات البيئة
# تأكد من أنك قمت بتعيين GOOGLE_API_KEY في بيئتك
genai.configure(api_key=os.environ.get("GOOGLE_API_KEY"))
# اختر النموذج الذي تريد استخدامه (gemini-pro للنصوص)
model = genai.GenerativeModel('gemini-pro')
# أرسل طلبًا لتوليد نص
prompt = "اكتب لي قصة قصيرة عن روبوت يكتشف المشاعر لأول مرة."
response = model.generate_content(prompt)
# اطبع النص الناتج
print(response.text)
أكثر من مجرد نصوص: قدرات Gemini المتعددة
1. فهم الصور وتوليد نصوص عنها
تخيل إنك تقدر توري Gemini صورة وتطلب منه يوصفها، يحللها، أو حتى يكتب قصة عنها! هذا مثال بسيط لكيف ممكن تسويها (تحتاج مكتبة Pillow لقراءة الصور):
pip install Pillow
import google.generativeai as genai
import os
from PIL import Image
genai.configure(api_key=os.environ.get("GOOGLE_API_KEY"))
# اختر النموذج المناسب للصور والنصوص (gemini-pro-vision)
model = genai.GenerativeModel('gemini-pro-vision')
# حمّل الصورة
img = Image.open('path/to/your/image.jpg') # استبدل بالمسار الصحيح لصورتك
# أرسل الصورة مع سؤال
prompt = "صف لي ما تراه في هذه الصورة بالتفصيل."
response = model.generate_content([prompt, img])
print(response.text)
ملاحظة: تأكد من استبدال
path/to/your/image.jpgبالمسار الفعلي للصورة عندك.
2. المحادثات التفاعلية (Chat Conversations)
Gemini مو بس يرد رد واحد، تقدر تبني معاه محادثة كاملة يتذكر فيها السياق السابق. هذا مفيد جدًا لبناء روبوتات محادثة (Chatbots) أو مساعدين شخصيين:
import google.generativeai as genai
import os
genai.configure(api_key=os.environ.get("GOOGLE_API_KEY"))
model = genai.GenerativeModel('gemini-pro')
chat = model.start_chat(history=[]) # ابدأ محادثة جديدة
print(chat.send_message("أهلاً، من أنت؟").text)
print(chat.send_message("ما هي عاصمة فرنسا؟").text)
print(chat.send_message("وماذا عن ألمانيا؟").text) # سيتذكر أنك تسأل عن عاصمة
نصائح أخيرة
- جرّب كثير: أفضل طريقة للتعلم هي التجربة. غيّر الأوامر (Prompts)، جرّب نماذج مختلفة.
- اقرأ التوثيق: توثيق جوجل الرسمي شامل جدًا وبيساعدك تفهم كل ميزات الـ API.
- فكّر في حالات الاستخدام: كيف ممكن تستخدم Gemini عشان يحل مشكلة معينة في تطبيقك؟ توليد محتوى؟ تحليل بيانات؟ مساعدة المستخدمين؟
أتمنى يكون هالدرس أعطاك بداية قوية مع Gemini API. الإمكانيات اللي يقدمها ضخمة، والكرة في ملعبك الآن عشان تبدع!