PDF چيست ؟ سوالي که اول ممکن است به ذهن برسد اين است که PDF فايل چيست؟ PDF از حروف portable document file گرفته شده است که بوسيله شرکت Adobe در دسترس همگان قرار گرفته است. اين فرمت ها از سال 1993 براي استانداردهاي اينترنت و همچنين توزيع هاي الکتريکي مورد استفاده قرار گرفت و تا کنون نيز شمار بسيار زيادي از اينگونه فايلها بر روي وب موجود است. PDF فايل ها بوسيله نرم افزارهايي که به اصطلاح portable document software گفته مي شوند به وجود مي آيند. ويژگي خاص فرمت ها به همراه داشتن image،graphic ، text در code اصلي فايلشان است. در واقع PDF فايلها ، style هايي که به آن اضافه مي شودجزو فايلهايي منحصر بفرد محسوب مي شوند. براي چه از PDF استفاده مي کنيم؟ علت اصلي استفاده از فرمت هاي PDF حجم کم اينگونه فايلها در مقايسه با فايلهاي HTML هم نوع خود است. PDF فرمت ها فشرده POSTSCRIPT مي باشد که مي تواند DOCUMENT با تمام ويژگيها را شامل شود که در HTML چنين کاري مقدور نيست.
تاريخچه PDF format 1980-2001 (1980) ساخت اساسيها
انقلاب نشر را بر روي صفحه ويندوز شعله ور کرد.
براي اکثر موارد چاپي شمرده مي شود اما خيلي مناسب براي استفاده محاوره اي نيست. postscript
خواهد بود.pdf قالب فايل هوشمند بعنوان شکل بعدي اساس
داستان آغاز مي شود.1991-1993 )92 ايجاد شد. (بهترين جايزه پاييز1993 ناميده ميشود در تابستان carousl کد آن Acrobat 1
در پست اسکريپت پشتيباني شد. hypertext
پست اسکريپت نسخه 2 را حمايت مي کند. Acrobat Distiller 2.0
توسط اديسون وسلي منتشر شد.pdfکتاب مرجع
قيمتي در حدود 50 دلار داشت.Acrobat Reader
سا ز گارهاي قبلي:1994
آغاز بکارکرد.pdf 1.1 همراه با Acrobat 2, 1994 در سپتامبر
را پشتيباني مي کند. plugin واسط کاربرAcrobat
ديسکها قرار دادند.PDF مستندات فني را در قالب (ADA) توسعه دهندگان وابسته
قرار دادند.CD درPDF مراجع ذي صلاح ماليات آمريکا مستندات اداري را در قالب
رمزسازي و جستجو و اتصال به وب را پشتيباني مي کند.Acrobat
بصورت مجاني در دسترس است.Acrobat
CompuServe توافقات طبقه شده براي
حمايت برنامه کاربردي وپذيرش کاربر 1995
گرفتن نسخه 1 با 4000 دلار آمريکايي که خصوصيا ت زير را داشت:
فقط انگليسي است کاراکترهاي خاص اروپايي را در بر نمي گيرد. فقط سياه و سفيد است. را براي اهداف تفسير و مرور و بازبيني شروع کردند. Acrobat
نيز مي باشد.prepressتنها براي تبديل مستندات نمايش نيست براي قرار دادن داده در دايره
را پوشش مي دهد Web , Adobe (1996)
در وب ظاهر مي شود.pdf مستندات
ايجاد شدl , pdf اتصال بين
روانه بازار شد.Amber با کد نام Acrobat3
اتصال وب و صفحه در يک زمان انجام گرفت.
ممکن نبود.pdf بارگذاري صفحا ت خاص
به باراز آمد.pdf براي مرور Netscapeمجاني plugins
بيش از يک موقعيت بازار (1997)
آکروبات گسترش مي يا بد.plugins بازار
پويا بر روي سرور قرار مي گيرد. PDF
در دسترس همگان قرار مي گيرد.Pdflib نسخه هاي
غير محاوره اي توليد مي شود. PDF
اختصاص مي يابد.Pdf , Acrobat يک روز کامل به sybold سمينارهاي
پشتيباني مي کنند اما هنوز بي نقض نيستند.pdf برنامه هاي کاربردي از
در بي خبري مانده اند.MS OFFICEکاربران
ابتدايي به صورت تقريبا شکسته وبسايت را بارکذاري مي کنند.Pdfmark
جدي مي شود(1998)
:PDF براي ورود Pagemaker - Plug in
جنبه وسيع شده اما براي ااستفاده کاربري محدود گشته است.
(زمينه)
منتشر کرده اند. Prepressبراي PDF متخصصان سويسي وآلماني يک کتاب جامع در مورد
براي سهولت انتخاب نياز است.Distiner به پرونده هاي
کار نمي کنند.quark press و تزئينات ما با وجود مشکلات PDF ترکيب
و توزيع آگهي را محدود مي کنند.PDF موانع سايز صفحه سرويس دهنده اعمال
مديريت ذرات رنگ فقط به صورت ابتدايي ممکن است.
مشکلات فونت تغير داده شده نه پيش نمايش جدا.
محققان سويسي و آلماني يك كتاب جامع در مورد PDF براي Prepress منتشر كردند.
ـ به پروندههاي Distiner براي مديريت سهولت انتخاب نياز دارد.
ـ سهولت ورود PDF به برنامههاي كاربردي DTP عمدهاي نيازمند بود.
ـ تركيب PDF و تزئينات ما با وجود مشكلات Quark press كار نميكنند. ـ خلاصهسازي، نشانههاي خلاصه كننده و پس دادن رنگ از دست ميروند. ـ موانع سايز صفحه سرويس دهنده اعمال PDF و توزيع آگهي را محدود ميكنند. ـ مديريت ذرات رنگ فقط به صورت ابتدايي ممكن است. ـ مشكلات فونت تعبيه شده ـ نه پيش نمايش جدا
Pluginهاي Acrobat محكم براي وظيفه Prepress:
ـ Enfocus cneck up همه خصوصيات مربوط فايل PDF را چك ميكند ( پيش نمايش) Quite lmposinf اعمالي در حد استعطاعت به وسيله Acrobat تحويل ميدهد. Lantana crader jack جداسازي رنگ را فراهم ميكند. (نفوذ گري در جداسازي RTP) ـ Enfocus pitstop براي نمايش محتويات صفحه Ayfa اولين جريانهاي كاري سيستم Apogce مبتني بر PDF را ارائه ميدهد. ـ كمپانيها شروع به فروختن PDF در سطح WEB كردند. ـ از طريق رمز سازي امتيازات تجاري را حمايت ميكند. ـ توليدات ثانويه شكافهاي كاربردي در Acrobat را پر ميكند. ـ plugin هاي متغير ـ plugin ويرايشي ـ ابزارهاي بسياري ميزان زيادي از اسناد PDF را رسيدگي ميكنند. ـ پردازش دستهاي
1999 Acrobat 4 از راه ميرسد
Acrobat Exchange ، يك برنامه كاربردي كه در بستهكاربردي وجود داشت، كه هم اكنون “Acrobat” ناميده ميشود. ـ حمايت از microsoft office ـ افت و تأخير توليد PDF براي كاربران نوآموز ـ بهبود تغيير و جنبههاي نشانه گذاري ـ امضاي ديجيتالي و مقايسه اسناد
ـ perpress : * پروندههاي Distiter *استفاده prepress هنوز به خاطر تعداد زيادي اشتباه سخت محدود شده است.
يكپارچهسازي اينترنت:
تسخير وب Acrobat را به عنوان يك مرورگر وب ميسازد و محتويات Html به عنوان يك فايل PDF نگهداري ميكند. ـ micrsoft به طور غير عمدي يك فايل PDF روي سرويس دهنده WEB خود قرار داد. (كشف شد بوسيله karl de Abrew )
1999: بين المللي كردن
ـ Acrobat 4 در انواع نسخههاي مختلفي قرار ميدهد. ـ يونيكد در قالب فايل و نرمافزار حمايت ميكند. * unicade به آساني براي عناصر ابر متن در دسترس است. * فونت بر جاي مانده postscript هنوز هم از پشتيباني كامل براي توضيحات صفحه ميكاهد. * فونت CID زبانهاي چيني و ژاپني و كرهاي پشتيباني ميكند. * Adobe به طور مجاني يك مجموعه از فونتهاي CJK را توزيع ميكند. * نمايش نسخههاي Acrobat بدون CJK و چاپ مستندات آسيايي
2000: جهان واقعي
ـ مشكلات با Acrobat 4 ـ با مشكلات جدي در استفاده perpress ـ فقدان چندين macintosh plugin ـ Adobe Acrobat distiter خروجي post Adobe Frame marker را وقتي كه راه انداز چاپگر استفاده ميشود را دوست ندارد. ـ Acrobat 4.s زمينههاي بسياري را مورد اشاره قرار ميدهد اما: * تأخير زياد در تحويل * نسخه آسماني Acrobat 4.s در may 2000 رسيد. پس از شش ماه آگهي و بعد از تلفنهاي زياد. * Acrobat 4.s به وسيله Acrobat 4.s به روز آورده ميشود اما شما واقعاً نياز نخواهيد داشت. * احساس سردرگمي هنگام استفاده از كلمات (اصلاحات) تجاري، قابليت دسترسي و شماره گذاري ايجاد ميشود.
2000: PDF در prepress
ـ چندين راه حل نتيجه (انتهايي) جريان كاري در دسترس هستند. ـ Agfa Apogcc ـ Heaidelbergrcrco Princrgy ـ Sciten Brisque ـ امتيازات Plugins در دسترس ـ چاپ دادههاي متغير: PPNL , PDF و ساير قالبيتها را در بر ميگيرد. ـ تكميل استاندارد PDF/ X براي مبادله و prepress ـ هنوز تلاش ديگري در ليستهاي وظيفه استاندارد وجود دارد: قابليت تعريف (JDF) ـ قابليت ويرايش PDF
2000 تأثير PDF برروي Web
ـ كابرد PDF روي اينترنت ماوراي توده بحراني است. * 100 ميليون طبق كپي از Acrobat Reader روي web بارگذاري شده است. * بر طبق Stot market , 36% همه كاربران Netscape و plugin نصب شده Acrobat را دارند. درمرتبه پنجم بعد از (Realplayer plugins , Beatink , Qick time, Avc) (تعداد جستجوهاي كه در Altavista با موفيقت برخورد ميكنند (فقط اسناد) HTML مورد جستجو واقع شدهاند) ـ S6ML = 275000 ـXML 665000 ـ Postscrip S2400
2000 : PDF در طرف سرويس دهنده
ـ افزايش تقاضا براي توليد PDF در روي سرويس دهنده ـ سرويس دهنده Acrobat Distiller براي استفاده برروي اينترنت و اينترانت اعلان شد. ـ سيستمهاي انتشار مثبتي بر XML: 2000مديريت متن و دستكاري آن در XML 2001 ارائه كاربر در ابتدا در قالب HTML و XML به علاوه Style Sheet 2002 ارائه كاربر (در نهايت) در PDF PDF LIB: PDF روي سرويس دهنده ايجاد ميكند. ـ آساني و وضوح براي استفاده API ـ در جفت از ايستگاههاي كاري حمايت شدند (پشتيباني شدند) ـ تنوع زيادي از زبانهاي برنامهسازي و محيطهاي web پشتيباني شدند.
توليد سريع PDF
ـ براي اطلاعات بيشتر سايت www. PDFlib.com را ببنيد.
2000 - سرويس گيرندههاي متناوب
Acrobat Viewersبراي Java : * قسمتي از ايستگاههاي كاري * تكنولوژي و منبع مختصر ميشود * محدود در عمل plagins در دسترس نيست. PDF روي PDA ها: Ansyr Primer براي windowse CE: نسخههايي از PC هاي جيبي و سيستم عامل Plom اعلام كردهاند. ـ نمونه PDF را با استفاده از اندازه صفحه Plam جور ميكند. ـ سرويس دهنده Adobe PDF, (ADS) را به HTML تبديل ميكند (قابليتهاي مبتني بر پوش نمايي براي مرور و بازبيني سرويس گيرنده غير مطلع از PDF) 2000: PDF و اشباي الكترونيكي (E- Thing) Adobe اصلاح cpaper را براي استفاده ميكند. خريد و بي Acrobat و PDF تجارتي : فروش كدگذاري شده PDF روي وب PDF هاي خريداري شده به يك ماشين مخصوص، يا ديسك يا سيستم عامل خاص وابسته هستند.
كتابهاي الكترونيكي به وسيله PDF:
Gloss book Reader : Acrobat Reader به وسيله يك پوشش كتابي و سيستم توزيع شده بستهبندي شده است. هر كتابي به Reader اختصاص يافته است. سخت افزار با پشتيباني PDF توكار و صفحه نمايش دو برابر ـ تكميل استانداردهاي كتابهاي الكترونيكي 2003كتاب الكترونيكي گسترده (OEB) قالب مبتني بر CSS, XML 2004 تبديل كتاب الكترونيكي (EBX): يك قالب متن نيست اما يك سيستم توزيع مخفي كه توسط PDF به كاربرده شده است. 2000: PDF خوب به نظر ميرسد، اما هدف مندي مجدد محتواي PDF هنوز مشكل است: * با وجود نگهداري كامل صفحه بندي، Acrobat هنوز در مورد محتواي متنها نميداند. 2005فحات، متونها، خطها (سطرها) ، آنها همه چيزهايي هستند كه بايد در جايي قرار داده شوند. 2006مرورهاي متفاوت متن (نمايش در مقابل چاپ) 2007 PDF ظاهر را ضمانت ميكند ولي در ساختار را ناديده ميگيرد. كاربران ميخواهند كه: 1 برش و جايگذاري با وجود ايجاد ايستگاه كاري ، فونت و رمز گذاري 2 متن استخراج ميشود بنابراين ميتواند استفاده مجدد شود (مثال خطوط تيره را حذف كند، ستونهاي متن متصل را گرد هم آورد) 3 ابزارهاي ثانويه براي تبديل و استخراج خوب هستند، اما بايد به طور مكاشفهاي به كار روند.
2000 : XML تمام جهان را تحريك ميكند.
* XML در زبان نشانهگذاري قابل گسترش يك ؟ زبان براي توصيف متون و داده و هر نوعي است. علت tagهايش مانند HTML به نظر ميرسد. ـ XML از SGML مشتق شده است 90% از كاربرد SGML را پيشنهاد ميكند و 10% از پيچيدگي آن را. مزاياي XML بر SGML ، پيچيدگي كمتر - قابل گسترش بودن - مبتني بر وب
تقسيم سخت ساختار و ظاهر متن:
ـ ساختار به وسيله نشانگذاري توصيف شده است و مشابه تگهاي HTML ـ نمايش و ظاهر به وسيله صفحات Style Sheet توصيف شده است. XML به عنوان يك ايستگاه عمومي براي تبديل داده نشان گرفته شده است. 2000: Sidebar ـ رفتن از XML به سوي PDF ـ XML همه ساختارهاي متن را دارد ولي قابل بندي ندارد. ـ Style Sheet به صفحات مورد نياز اضافه ميشوند. زبان Style Sheet قابل گسترش (XSL) استاندارد تصويب شده W3C خواهد بود. ـ XSLT براي تغيير شكل متون XML ـ اشياي قالب بندي شده (FO) براي توصيف طرح نهايي. و يك ماشين قالب بندي عمومي لازم ميشود: 2000XML را بگيريد و Style Sheet را به كار گيريد. 2001 خروجي نتيجه مانند PDF است. پردازشگر XEP فقط آن را انجام ميدهد. 1موتور تبديل كامل XSL/ FO مبتني بر Frame براي تبديل XML به PDF 2 كتابخانه PDF را به عنوان پشتيبان به كار ميگيرد. 3 براي ديدن جزئيات بيشتر www.render.com را ببينيد.
2000: ويژگيهاي ساختاري PDF 1.3 / Acrobat 4
ـ PDF اطلاعات ساختاري تعبيه شده در درون متن را پشتيباني ميكند. ـ پتانسيل زياد، اما در كاربردهاي امروزي به ندرت به كار رفته است. ـ ميتواند تعهد قبلي به وقوع بپيوندد و Post Scrip و SGML را با هم تركيب كند و يا PDF , XML و يا ساختار و ظاهر متن را با هم تركيب كند. در نهايت هدف مندي مجدد محتواي متن شما وقتي آنها را در يك قالب نهايي نگهداري ميكند. ـ بايگاني هم ساختار و هم نمايش متن در يك قالب فايل تنها. ـ كاربردهاي ممكن: ـ استخراج محتويات ـ تبديل هوشمندانه PDF به ديگر قالبها ـ كمك به پويش متن ـ گردش دو طرفه
2000: PDF ساخت يافته به جزئيات بيشتر
ما احتياج به اطلاعات در مورد متون به علاوه محتواي حقيقي داريم. فراداده = اطلاعات در مورد كل متن ساختار= اطلاعات در مورد ساختار متن و تقسيمات آنها مشكل پايه: اغلب متن در PDF به سختي تكه تكه ميشود. چگونهميتوان قسمتهاي محتواي را به صورت انفرادي آدرس دهي كرد؟ ـ تشخيص محتوا در متن: بلاكهاي متن مطابق اصول منطقي به هم وصل كنيد. بر خلاف XML متن تنها قسمتي از يك عنصر نميتواند باشد بلكه هر نوعي از محتواي ارائه شده ميتواند باشدو (محتواي معلوم : Xobjects) ـ محتوا در يك ساختار درخت مانند سازمان دهي شده است:
سيستم سلسله مراتبي عناصر مختلف
2000 هر عنصري ميتواند به برخي از محتواي متن يا متن يا عناصر ديگر اشاره كند. 2001 اجزاي منطقي علاوه بر ويژگيهاي كاربردي ميتواند تعريف شود. 2000: انواع عناصر PDF و خواص و صفات آنها نوع عنصر ممكن است به عنوان نام بر چسبي عنصر تلقي شود. Adobe استفاده از انواع استاندارد شبيه تگهاي HTML را پيشنهاد ميكند. ـ اجزاي استاندارد براي متن مرتب خطي در يك سلسله مراتب عبارتند از: تيتربه بخش ، پاراگراف، ليست، اجزاي ليست، عنوان جدول، نام جدول، دادههاي جدول، شكل، انديس، محتويات جدول ـ انواع داده استاندارد در هدف بندي مجددو گسترش دو طرفه كمك ميكند. اجزاي مشخصه برنامههاي كاربردي براي مثال اقلام فاكتور و اعداد ترتيبي صفات اجزاي ساختار بيشتر توصيف ميكنند و نقش معين كاربردي يك جز را تعريف ميكنند. ـ صفات استاندارد مثل ارجاع و لينكها ـ صفات به برنامه كاربردي كه آنها را ايجاد كرده تعلق دارند. 2000: ايجاد PDF ساخت يافته ـ تسخير وب توسط ِacrobat ـ ساختار اطلاعات را از متن HTML به ساختار PDF تبديل ميكند. ـ متن مقداري آگاهي از منبع خود دارد. PDF marker براي Microsoft word : PDF ساخت يافته از شيوههاي پاراگرافي ايجاد ميكند. Frame marker6 : PDF ساخت يافته را از طريق روشهاي پاراگرافي ايجاد ميكند. Abode Iliustrator و LN Design به طور هندسي قبلاً ساختار و Class comp را استفاده ميكردند.
راههاي دستيابي تكنيكي:
ـ عملگر PDF mark: كد post Scrip اطلاعات ساختار را شامل ميشود. ـ رابط كاربر برنامه نويس Acrobat plugin 2000: استفاده از PDF ساخت يافته Book mark هاي ساخت يافته: بر خلاف Book mark هاي متداول Book mark ساخت يافته به يك محل مشخص در متن اشاره ميكند اما به يك عنصر ساختاري مشخص اشاره ميكند. ـ Book mark ساخت يافته ممكن است به يك سلسله صفحه ضميمه شده باشد. ـ آنها در مورد قسمتهاي متناظر متن ميدانند. نشان گذاريهاي (Book mark) ساخت يافته ميتوانند از اطلاعاتي كه به آنها ضميمه شده استفاده كنند. ـ همه صفحات اين Book mark ها را چاپ ميكنند. ـ همه Book markهاي ساخت يافته و همه صفحات مطابق را حذف ميكنند. ـ صفحات را استخراج ميكنند. ـ Book mark ها و صفحات مطابق آنها را حركت ميدهند. ـ Book mark هاي مبتني بر اطلاعات ساختار ايجاد ميكنند. ـ نشان گذاريهاي جديد از ساختار (Book mark) Book mark ساخت يافته همراه با اطلاعات وب وابسته ـ ضميمه كردن به سطح بعدي ـ مشاهده لينك هاي وب ـ باز كردن صفحات با مرورگ 2000 : مثال پروژه روزنامه WINDS WINDS (در سرويس توزيع نوري روزنامه جهان در سرتاسر جهان) يك پروژه بين المللي است كه به وسيله اروپايي سرمايه گذاري شده است. ـ كمپانيهاي شركت كننده شامل Adobe به عنوان آغازگر تكنيكي و چندين ناشر روزنامه هستند. ـ روزنامهها را در قالب PDF در اينترنت و انتشار ماهوارهاي توزيع ميكنند. ـ هدف بندي مجدد در ويرايش چاپ شده براي تجارت الكترونيكي ـ روزنامه PDF ، WINDS نمايش صفحه و ساختار صفحه را شامل ميشود. ـ Plugins ، NC svs Acrobat از اطلاعات ساختار استفاده ميكند. ـ قالب بندي مقالات طولاني در يك قالب دوست داشتني به صفحه نمايش ـ توليد اخبار خلاصه به طور انفرادي با استخراج از مقالات برگزيده ـ تكنيكهاي مشابه بر روي سرويس دهنده ـ پياده سازي تجاري از خريد و فروش PDF تحت وب استفاده ميكنند ـ اطلاعات بيشتري در سايت WWW. WINDS.cd.com در دسترس است. 2000: برنامههاي كاربردي پيشرفته از خروج PDF پشتيباني ميكنند. ـ PDF با قابليت انعطاف كامل Distiller صادر ميشود اما بدون نياز به Post Script ـ ساختار متن در صدور PDF حفظ ميشود ـ برنامههاي كاربردي كاملاً ورود PDF را پشتيباني ميكند. ـ ورود PDF همراه با قابليت ويرايش كامل ـ ساختار متن در ورود PDF محفوظ ميماند كيفيت جديد مربوط به استفاده PDF در سرويس دهنده وب ـ سيستم انتشار مبتني بر WEB دادهها را به هم نميزند ـ توليد PDF مورد تقاضاي كاربر اما كاربر آن را تقاضا كند ـ PDF شامل اطلاعات ساختار بر اساس مجدد آسانتر است.
مشکلات pdf فايلها
تا کنون مزاياي زيادي در مورد فرمتهاي pdf و تاريخچه اي نيز در مورد آن گفته شد. جالب است
بدانيم که اين دسته از فايلها نيز منتقدان زيادي دارند و پا ره اي از مشکلات را به همراه دارند.
1-:linear exposition اين دسته از فرمتها فايلهاي فشرده شده به منظور گرفتن پرينت هستند و
به همين جهت fit کردن آنها در صفحه کار سختي است و خواندن آنها از روي صفحه نمايش
مشکلات زيادي را براي کاربر ايجاد ميکند.
2-crash and software problem : هنوز در اين فرمتها امکان crash وجود دارد
اگرچه اين مشکل نسبت به گذشته کاهش يافته است.
3-break flow: اين مشکل را مي توان اينگونه بيان کرد که اين دسته فايلها زمان بسيار زيادي
براي download شدن لازم داشته واحتياج به يک reader دارند.