Μια από τις σημαντικότερες μετρικές οι οποίες χαρακτηρίζουν μια υπηρεσία πολυμέσων είναι η ποιότητα με την οποία την αντιλαμβάνεται ο τελικός χρήστης, γνωστή και ως ποιότητα εμπειρίας (Quality of Experience - QoE). Η μετρική αυτή σχετίζεται άμεσα με την επιλογή του χρήστη να συνεχίσει να χρησιμοποιεί (και ίσως να πληρώνει) την υπηρεσία ή να την διακόψει. Οι πάροχοι πολυμεσικών υπηρεσιών, προκειμένου να εξασφαλίσουν την ικανοποίηση των πελατών τους, αναπτύσσουν μεθόδους για τον αυτόματο (χωρίς την άμεση συμμετοχή του χρήστη) υπολογισμό της QoE.
Μία τέτοια μέθοδος είναι η Video Multi-Method Assessment Fusion (VMAF), που έχει προταθεί από τη Netflix. Η VMAF προσφέρει μια αυτοματοποιημένη εκτίμηση της ποιότητας εικόνας σε κάθε πλαίσιο μιας ακολουθίας βίντεο. Στη συνέχεια της διαδικασίας, υπολογίζεται ο αριθμητικός μέσος όρος των μετρήσεων ποιότητας ανά πλαίσιο, προκειμένου να ληφθεί μια εκτίμηση της συνολικής QoE της ακολουθίας βίντεο.
Σε αυτή την εργασία επικυρώνουμε την υπόθεση ότι ο αριθμητικός μέσος, ως μέθοδος χρονικής συγκέντρωσης (temporal pooling method), υποεκτιμά την συνεισφορά των πλαισίων κακής ποιότητας στον υπολογισμό της QoE, οδηγώντας σε τιμές υψηλότερες από αυτές που δίνονται από υποκειμενικές μετρήσεις. Δείχνουμε επίσης ότι το άθροισμα Minkowski (κατάλληλα παραμετροποιημένο) προσεγγίζει βέλτιστα τις υποκειμενικές μετρήσεις QoE. H ποσοτικοποίηση αυτής της προσέγγισης αποτυπώνεται με τη χρήση των κυριότερων συντελεστών συσχέτισης, δηλαδή, Spearman Rank Correlation Coefficient (SRCC), Pearson Correlation Coefficient (PCC) καθώς και συμβατικά με την χρήση της ρίζας του μέσου τετραγωνικού σφάλματος, Root-Mean-Square-Error (RMSE).
(EL)
One of the key elements that characterizes a multimedia service is its quality. This feature is an important factor that will lead a user to satisfaction and further use or avoidance. For this reason, it is especially necessary for multimedia service providers, in order to ensure the satisfaction of their customers, to develop metrics to calculate the user’s QoE (Quality of Experience).
The Video Multimethod Assessment Fusion (VMAF) method, proposed by Netflix, offers an automated estimation of perceptual video quality for each frame of a video sequence. Then, the arithmetic mean of the per-frame quality measurements is taken by default, in order to obtain an estimate of the overall QoE of the video sequence. In this paper, we validate the hypothesis that the arithmetic mean conceals the bad quality frames, leading to an overestimation of the provided quality. We also show that the Minkowski mean (appropriately parametrized) approximates well the subjectively measured QoE, providing superior Spearman Rank Correlation Coefficient (SRCC), Pearson Correlation Coefficient (PCC), and Root-Mean-Square-Error (RMSE) scores.
(EN)